Lignage des données dans un environnement Big Data
Actian Corporation
1er mars 2018

La lignée des données est définie comme un type de cycle de vie des données. Il s'agit d'une représentation détaillée de toute donnée au fil du temps : son origine, ses processus et ses transformations. Bien qu'il ne s'agisse pas d'un tout nouveau concept, un changement de paradigme est en train de s'opérer, un changement de paradigme est en train de s'opérer.
L'obtention de l'historique des données à partir d'un entrepôt de données, par exemple, était une tâche assez simple. Ce système de stockage centralisé permettait, "par conception", d'obtenir le lignage des données à partir des données stockées au même endroit.
L'écosystème des données évolue très rapidement depuis l'émergence du Big Data en raison de l'apparition de diverses technologies et systèmes de stockage qui compliquent les systèmes d'information des entreprises.
Il est devenu impossible de conserver et d'imposer un outil unique et centralisé dans les organisations. Les logiciels et les méthodes utilisés par les urbanistes et les architectes des SI de "l'ancien monde" sont devenus de moins en moins maintenables, rendant leurs travaux obsolètes et illisibles.
Alors, comment visualiser une lignée de données efficace dans un environnement Big Data ?
Pour avoir une vision globale des données du SI d'une entreprise, de nouveaux outils apparaissent. On parle de catalogue de données. Il permet de traiter un maximum de métadonnées issues de tous les stockages de données via une interface utilisateur. En centralisant toutes ces informations, il est possible de créer des lignées de données dans un environnement Big Data à différents niveaux :
Cependant, cette norme de lignage des données ne permet pas à elle seule de répondre à toutes les questions des utilisateurs de données. Entre autres, ces questions demeurent : Qu'en est-il des données sensibles ? Quelles colonnes ont été créées et avec quels processus ? etc.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.