Intelligence des données

Guide to Data Quality Management #4 - catalogue de données Contribution to DQM

Actian Corporation

4 avril 2022

Contribution Gestion de la qualité des données

La qualité des données fait référence à la capacité d'une organisation à maintenir la qualité de ses données dans le temps. Si nous prenons au mot certains professionnels des données, l'amélioration de la qualité des données est la panacée à tous les maux de l'entreprise et devrait donc être la priorité absolue.

Chez Zeenea, nous pensons que cela doit être nuancé : La qualité des données est un moyen parmi d'autres de limiter les incertitudes liées à la réalisation des objectifs de l'entreprise.

Dans cette série d'articles, nous allons passer en revue tout ce que les professionnels des données doivent savoir sur la gestion de la qualité des données (DQM) :

  1. Les neuf dimensions de la qualité des données
  2. Les défis et les risques associés à la qualité des données
  3. Les principales caractéristiques des outils de gestion de la qualité des données
  4. La contribution du catalogue de données à DQM

Un catalogue de données n'est pas un outil DQM

Un élément essentiel est qu'un catalogue de données ne doit pas être considéré comme un outil de gestion de la qualité des données en soi.

Tout d'abord, l'un des principes fondamentaux au cœur de la qualité des données est que les contrôles devraient idéalement avoir lieu dans le système source. L'exécution de ces contrôles uniquement dans le catalogue de données - plutôt qu'à la source et dans le flux de transformation des données - augmente le coût global de l'entreprise.

De plus, un catalogue de données doit être à la fois complet et peu intrusif pour faciliter son déploiement rapide au sein de l'entreprise. Ceci est tout simplement incompatible avec la nature complexe de la transformation des données et la multitude d'outils utilisés pour effectuer ces transformations.

Enfin, un catalogue de données doit rester un outil simple à comprendre et à utiliser.

Comment un catalogue de données contribue-t-il à la gestion de la qualité ?

Si le catalogue de données n'est pas un outil de qualité des données, sa contribution au maintien de la qualité des données est néanmoins substantielle. Voici comment :

  • Un catalogue de données permet aux consommateurs de données de comprendre facilement les métadonnées et d'éviter les interprétations hasardeuses. interprétations hasardeuses des données. Il fait écho à la dimension de clarté de la qualité ;
  • Un catalogue de données donne une vue centralisée de toutes les données d'entreprise disponibles.. Les informations sur la qualité des données sont donc des métadonnées comme les autres qui portent une valeur et doivent être mises à la disposition de tous. Elles sont faciles à interpréter et à extraire, ce qui fait écho aux dimensions d'exactitude, de validité, de cohérence, d'unicité, d'exhaustivité et d'actualité.
  • Un catalogue de données possède des capacités de traçabilité des données (Data Lineage), faisant écho à la dimension de traçabilité de la qualité ;
  • Un catalogue de données permet généralement un accès direct aux sources de donnéesce qui fait écho à la dimension "disponibilité" de la qualité.

La stratégie de mise en œuvre du DQM

Le tableau suivant détaille la prise en compte de la qualité des données en fonction des différentes solutions disponibles sur le marché :

Comme indiqué ci-dessus, les tests de qualité devraient par défaut être effectués directement dans le système source. L'intégration des tests de qualité dans un catalogue de données peut améliorer l'expérience de l'utilisateur , mais elle n'est pas indispensable compte tenu de ses limites - la qualité des données n'étant pas intégrée dans le flux de transformation.

Cela dit, lorsque les piles de systèmes deviennent trop complexes et qu'il faut, par exemple, consolider des données provenant de différents systèmes ayant des règles fonctionnelles différentes, un outil de qualité des données devient inévitable.

La stratégie de mise en œuvre dépendra des cas d'utilisation et des objectifs de l'entreprise. Il est néanmoins judicieux de mettre en place la qualité des données de manière progressive afin de :

  1. S'assurer que les systèmes sources ont mis en place les règles de qualité appropriées ;
  2. Mettre en place un catalogue de données pour améliorer la qualité sur les plans de la clarté, de la traçabilité et/ou de la disponibilité ;
  3. Intégrer la qualité des données dans les flux de transformation avec un outil spécialisé tout en important ces informations automatiquement dans le catalogue de données via des API.

Conclusion

La qualité des données fait référence à la capacité d'une entreprise à maintenir la durabilité de ses données dans le temps. Chez Zeenea, nous la définissons à travers le prisme de neuf des soixante dimensions décrites par DAMA International : l'exhaustivité, l'exactitude, la validité, l'unicité, la cohérence, l'actualité, la traçabilité, la clarté et la disponibilité.

En tant que fournisseur de catalogue de données , nous rejetons l'idée qu'un catalogue de données est un outil de gestion de la qualité à part entière. En fait, il ne s'agit que d'un moyen parmi d'autres de contribuer à l'amélioration de la qualité des données, notamment à travers les dimensions de clarté, de disponibilité et de traçabilité.

Obtenir notre Guide de gestion de la qualité des données pour les organisations pilotées par les données

Pour plus d'informations sur la qualité des données et la gestion de la qualité des données, téléchargez notre guide gratuit : "Guide de la gestion de la qualité des données". Télécharger l'eBook.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.