

Associés aux technologies du cloud, les acronymes IaaS, PaaS, SaaS doivent être compris : connaissez-vous la virtusalisation ?
Le média de ceux qui réinventent l'entreprise
Depuis une dizaine d’années, la progression vertigineuse des données produites a accéléré le développement du big data. Les mondes du développement applicatif et de la gestion des données ont commencé à converger.
Dans ce cadre, savoir centraliser, structurer, traiter et analyser une masse de données pour une problématique précise est essentiel : c’est tout l’objet d’un data mart. Que couvre cette notion exactement ? En quoi est-ce différent d’un data warehouse ? Explications.
Un datamart, aussi appelé magasin de données ou comptoir de données, est une base de données précise destinée à un groupe d’utilisateurs donné.
Utilisé en informatique décisionnelle, il est extrait de systèmes sources puis nettoyé et mis à disposition des utilisateurs d’un domaine spécifique de l’entreprise, ou d’un groupe restreint d’utilisateurs.
Exemple de Data mart en image — © Talend
👉 Le datamart doit être au service du besoin final et donc retranscrire de la manière la plus intelligible et proche du langage métier possible les données initialement stockées dans le Datawarehouse.
On peut ainsi imaginer qu’au sein du domaine RH d’une société, un premier datamart compile tous les indicateurs relatifs à l’utilisation de l’ERP principal, et que d’autres « briques » du besoin RH soient des datamarts directement associés à des applications secondaires et très spécifiques, par exemple le suivi du e-Learning des employés.
Selon les conceptions donc, le Datawarehouse, ou entrepôt de données, peut être vu comme un ensemble de Datamarts et de leurs passerelles ou, plus couramment, comme la centralisation dans un même système assurant la sécurité, la disponibilité et la cohérence technique de toutes les données à l’usage des datamarts.
Il revêt donc une coloration plus technique et n’aura sans doute pas un unique champ « Chiffre d’Affaires », mais peut-être plusieurs composantes du Revenu et des charges de la société que chaque domaine agencera selon sa conception propre du CA.
Le Data warehouse permettra d’ailleurs d’assurer la traçabilité de l’information à travers l’ensemble de l’entreprise, là où le Data mart se limite à satisfaire les besoins spécifiques d’un métier.
Si vous privilégiez les datamarts dédiés à une application, c’est peut-être parce que l’applicatif lui-même vous propose des outils d’analyse intégrés. Cela vous paraît la solution idéale.
Avantage : coller au plus près du besoin adressé par l’application et d’assurer la cohérence entre la donnée et sa restitution.
Inconvénients :
👉 Vous perdrez donc en potentiel ce que vous aurez gagné en rapidité de mise en place.
Il s’agit là d’une version plus avancée du précédent, puisqu’il peut avoir été mis en place en interne, mais toujours à partir d’une source bien spécifique dont il est très dépendant.
Avantage : vous avez plus de latitude sur les éléments de restitution.
Inconvénient : le fait qu’il ne soit pas intégré au reste de votre entrepôt de données rogne toujours votre potentiel de réponse au besoin utilisateur à moyen terme.
Les datamarts ont tout intérêt à s’articuler autour d’un datawarehouse afin de maximiser leur potentiel. Leur intégration peut être :
Avantages :
Inconvénient : perte en indépendance
Bien sûr, les outils ETL ne manquent pas pour traiter des données en masse et les analyser rapidement.
Mais il existe également des outils de stockage dédiés, open source ou propriétaires, clés en main pour votre data mart.
Comme pour tout choix mettant en concurrence l’open source avec des solutions éditeurs, c’est le support, et la capacité interne pour développer ou adapter des composants qui seront les critères à prendre en compte.
L’intégration de vos data marts à un data warehouse doit être un objectif majeur de votre architecture. Et la bonne évolution de ce data warehouse est son corollaire.
Les équipes techniques étant exposées à toujours plus de demandes et à un besoin accru de réactivité, il a fallu adapter les modes de développement et de déploiement via les techniques d’intégration continue qui ont fait leurs preuves dans le monde applicatif. C’est donc à un nouveau paradigme que l’ingénierie des données doit se soumettre : le DataOps, dérivé du DevOps.
En résumé, l’adaptation des principes du DevOps au monde de la Data offre une nouvelle réponse aux défis de la mise en place des datamarts dans un contexte de forte croissance.