Intelligence des données

Guide de la gestion de la qualité des données #2 - Les défis de la qualité des données

Actian Corporation

2 avril 2022

Les 9 dimensions de la qualité des données

La qualité des données fait référence à la capacité d'une organisation à maintenir la qualité de ses données dans le temps. Si nous prenons au mot certains professionnels des données, l'amélioration de la qualité des données est la panacée à tous les maux de l'entreprise et devrait donc être la priorité absolue. 

Chez Zeenea, nous pensons que cela doit être nuancé : La qualité des données est un moyen parmi d'autres de limiter les incertitudes liées à la réalisation des objectifs de l'entreprise. 

Dans cette série d'articles, nous allons passer en revue tout ce que les professionnels des données doivent savoir sur la gestion de la qualité des données (DQM) :

  1. Les neuf dimensions de la qualité des données
  2. Les défis et les risques associés à la qualité des données
  3. Les principales caractéristiques des outils de gestion de la qualité des données
  4. La contribution du catalogue de données à DQM

Les défis de la qualité des données pour les organisations

Les initiatives visant à améliorer la qualité des données sont généralement mises en place par les organisations pour répondre aux exigences de conformité et de réduction des risques. Elles sont indispensables à une prise de décision fiable. Malheureusement, de nombreuses pierres d'achoppement peuvent entraver les initiatives d'amélioration de la qualité des données. En voici quelques exemples :

  • La croissance exponentielle du volume, de la vitesse et de la variété des données rend l'environnement plus complexe et plus incertain.
  • La pression croissante des réglementations de conformité telles que GDPR, BCBS 239, ou HIPAA.
  • Les équipes sont de plus en plus décentralisées et chacune a son domaine d'expertise.
  • Les équipes informatiques et de données sont débordées et n'ont pas le temps de résoudre les problèmes de qualité des données.
  • Les processus d'agrégation des données sont complexes et longs.
  • Il peut être difficile de normaliser les données entre différentes sources.
  • Les audits de changement entre les systèmes sont complexes.
  • les politiques de gouvernance sont difficiles à mettre en œuvre.

Cela dit, il y a aussi de nombreuses opportunités à saisir. Des données de qualité permettent aux organisations de faciliter l'innovation grâce à l'intelligence artificielle et de garantir une expérience client plus personnalisée. En supposant qu'il y ait suffisamment de données de qualité. 

Gartner a en effet prévu que jusqu'en 2022, 85% des projets d'IA produiront des données erronées en raison de biais dans les données, les algorithmes, ou de la part des équipes en charge de la gestion des données.

Réduire le niveau de risque en améliorant la qualité des données

La mauvaise qualité des données doit être considérée comme un risque et les logiciels d'amélioration de la qualité comme une solution possible pour réduire ce niveau de risque.

Traitement d'un problème de qualité

Si nous acceptons la notion ci-dessus, tout problème de qualité devrait être traité en plusieurs phases :

1. Identification des risques: Cette phase consiste à rechercher, reconnaître et décrire les risques qui peuvent aider/empêcher l'organisation d'atteindre ses objectifs - en partie à cause d'un manque de qualité des données.

2. Analyse des risques: L'objectif de cette phase est de comprendre la nature du risque et ses caractéristiques. Elle inclut les facteurs de similitude des événements et leurs conséquences, la nature et l'importance de ces conséquences, etc. Il s'agit ici de chercher à identifier ce qui a causé la mauvaise qualité des données marketing. On peut citer par exemple

  • Une mauvaise expérience de l'utilisateur du système source entraînant des erreurs de frappe ;
  • L'absence de vérification de l'exhaustivité, de l'exactitude, de la validité, de l'unicité, de la cohérence ou de l'actualité des données ;
  • L'absence de moyens simples pour assurer la traçabilité, la clarté et la disponibilité des données ;
  • L'absence d'un processus de gouvernance et ses implications pour les équipes commerciales.

3. Évaluation des risques: L'objectif de cette phase est de comparer les résultats de l'analyse des risques avec les critères de risque établis. Elle permet de déterminer si d'autres mesures sont nécessaires pour la prise de décision - par exemple, maintenir les moyens actuels en place, entreprendre une analyse plus approfondie, etc.

Concentrons-nous sur les neuf dimensions de la qualité des données et évaluons l'impact d'une mauvaise qualité sur chacune d'entre elles :

Les valeurs des niveaux de probabilité et de gravité doivent être définies par les principales parties prenantes, qui connaissent le mieux les données en question. 

4. Traitement des risques: Cette phase de traitement vise à définir les options disponibles pour réduire le risque et à les mettre en œuvre. Ce traitement implique également la capacité d'évaluer l'utilité des mesures prises, de déterminer si le risque résiduel est acceptable ou non et, dans ce dernier cas, d'envisager un traitement ultérieur.

Par conséquent, l'amélioration de la qualité des données n'est manifestement pas un objectif en soi :

  • Son coût doit être évalué en fonction des objectifs de l'entreprise.
  • Les traitements à mettre en œuvre doivent être évalués à travers chaque dimension de la qualité.

Obtenir notre Guide de gestion de la qualité des données pour les organisations pilotées par les données

Pour plus d'informations sur la qualité des données et la gestion de la qualité des données, téléchargez notre guide gratuit : "Guide de la gestion de la qualité des données". Télécharger l'eBook

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.