Et pourquoi pas choisir un ETL Open Source ?

L’ETL, ou « Extract Transform Load » est un outil qui permet d’extraire des données de sources hétérogènes et de transformer ces données afin d’alimenter des systèmes cible.

Par exemple, pour alimenter votre CRM vous pouvez le faire manuellement – l’opérateur qui renseigne les données sur le prospect lors qu’il est en contact avec lui – ou l’automatiser. Parfois un simple fichier d’alimentation suffit, mais le plus souvent, et notamment quand vos sources de données sont multiples et de structures différentes, la mise en œuvre d’un ETL permet alors de traiter de manière stable et pérenne vos alimentations de données.

L’ETL peut également vous permettre la construction d’un entrepôt de données vous permettant d’effectuer vos analyses décisionnelles en collectant et en homogénéisant vos différentes sources de données – votre comptabilité, votre CRM, vos outils de production, des données externes, etc. – afin de permettre des croisements de données pour une analyse pertinente pour votre activité.

En plus des fonctions de traitement des données, un ETL performant doit s’accompagner d’un certain nombre d’outils permettant la planification des traitements de données, la sécurisation des traitements et des données, la gestion des erreurs et rapports de traitements, etc.

Il existe maintenant sur le marché de nombreux ETL Open Source. Citons Pentaho Data Integration, Talend, Clover ETL pour les plus connus, qui tous offrent suffisamment de fonctionnalités et un pilotage graphique leur permettant d’atteindre des niveaux équivalents à ceux des offres propriétaires. Ces outils s’appuient sur des communautés importantes, l’offre Open Source ne doit donc plus susciter de craintes particulières sur la pérennité ou l’évolution de ces outils : il n’existe objectivement pas plus de risque de voir un outil Open Source répandu et adopté disparaître brutalement que de voir un éditeur même avec pignon sur rue et presse économique dithyrambique à son sujet, décider brutalement de changer de modèle ou d’abandonner un produit suite à une fusion-acquisition.

Après, reste à savoir quel ETL Open Source choisir. Sur les projets que nous avons accompagnés, le choix a toujours été sur l’alternative Talend / Pentaho. L’arbitrage peut dépendre du projet (tel point particulier des spécifications techniques étant mieux pris en charge ou mieux géré par l’un des deux ETL en lice), mais plus souvent de raisons plus subjectives comme les retours d’expériences des chefs de projets techniques – untel ayant plus d’expérience avec l’un -, les choix passés du client qui vont privilégier un outil par rapport à un autre, ou encore la lisibilité des stratégies commerciales des produits.

Si c’est la première expérience ETL, il n’est pas inutile de réfléchir dès cette phase de choix aux différentes applications futures de l’ETL afin de faire les bons choix d’architecture et de choisir celui qui à l’avenir sera plus proche des besoins potentiels.

Ce contenu a été publié dans Accompagnement, avec comme mot(s)-clé(s) , , . Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>