Guide de la gestion de la qualité des données #2 - Les défis de la qualité des données
Actian Corporation
2 avril 2022

La qualité des données fait référence à la capacité d'une organisation à maintenir la qualité de ses données dans le temps. Si nous prenons au mot certains professionnels des données, l'amélioration de la qualité des données est la panacée à tous les maux de l'entreprise et devrait donc être la priorité absolue.
Chez Zeenea, nous pensons que cela doit être nuancé : La qualité des données est un moyen parmi d'autres de limiter les incertitudes liées à la réalisation des objectifs de l'entreprise.
Dans cette série d'articles, nous allons passer en revue tout ce que les professionnels des données doivent savoir sur la gestion de la qualité des données (DQM) :
- Les neuf dimensions de la qualité des données
- Les défis et les risques associés à la qualité des données
- Les principales caractéristiques des outils de gestion de la qualité des données
- La contribution du catalogue de données à DQM
Les défis de la qualité des données pour les organisations
Les initiatives visant à améliorer la qualité des données sont généralement mises en place par les organisations pour répondre aux exigences de conformité et de réduction des risques. Elles sont indispensables à une prise de décision fiable. Malheureusement, de nombreuses pierres d'achoppement peuvent entraver les initiatives d'amélioration de la qualité des données. En voici quelques exemples :
- La croissance exponentielle du volume, de la vitesse et de la variété des données rend l'environnement plus complexe et plus incertain.
- La pression croissante des réglementations de conformité telles que GDPR, BCBS 239, ou HIPAA.
- Les équipes sont de plus en plus décentralisées et chacune a son domaine d'expertise.
- Les équipes informatiques et de données sont débordées et n'ont pas le temps de résoudre les problèmes de qualité des données.
- Les processus d'agrégation des données sont complexes et longs.
- Il peut être difficile de normaliser les données entre différentes sources.
- Les audits de changement entre les systèmes sont complexes.
- les politiques de gouvernance sont difficiles à mettre en œuvre.
Cela dit, il y a aussi de nombreuses opportunités à saisir. Des données de qualité permettent aux organisations de faciliter l'innovation grâce à l'intelligence artificielle et de garantir une expérience client plus personnalisée. En supposant qu'il y ait suffisamment de données de qualité.
Gartner a en effet prévu que jusqu'en 2022, 85% des projets d'IA produiront des données erronées en raison de biais dans les données, les algorithmes, ou de la part des équipes en charge de la gestion des données.
Réduire le niveau de risque en améliorant la qualité des données
La mauvaise qualité des données doit être considérée comme un risque et les logiciels d'amélioration de la qualité comme une solution possible pour réduire ce niveau de risque.
Traitement d'un problème de qualité
Si nous acceptons la notion ci-dessus, tout problème de qualité devrait être traité en plusieurs phases :
1. Identification des risques: Cette phase consiste à rechercher, reconnaître et décrire les risques qui peuvent aider/empêcher l'organisation d'atteindre ses objectifs - en partie à cause d'un manque de qualité des données.
2. Analyse des risques: L'objectif de cette phase est de comprendre la nature du risque et ses caractéristiques. Elle inclut les facteurs de similitude des événements et leurs conséquences, la nature et l'importance de ces conséquences, etc. Il s'agit ici de chercher à identifier ce qui a causé la mauvaise qualité des données marketing. On peut citer par exemple
- Une mauvaise expérience de l'utilisateur du système source entraînant des erreurs de frappe ;
- L'absence de vérification de l'exhaustivité, de l'exactitude, de la validité, de l'unicité, de la cohérence ou de l'actualité des données ;
- L'absence de moyens simples pour assurer la traçabilité, la clarté et la disponibilité des données ;
- L'absence d'un processus de gouvernance et ses implications pour les équipes commerciales.
3. Évaluation des risques: L'objectif de cette phase est de comparer les résultats de l'analyse des risques avec les critères de risque établis. Elle permet de déterminer si d'autres mesures sont nécessaires pour la prise de décision - par exemple, maintenir les moyens actuels en place, entreprendre une analyse plus approfondie, etc.
Concentrons-nous sur les neuf dimensions de la qualité des données et évaluons l'impact d'une mauvaise qualité sur chacune d'entre elles :
Les valeurs des niveaux de probabilité et de gravité doivent être définies par les principales parties prenantes, qui connaissent le mieux les données en question.
4. Traitement des risques: Cette phase de traitement vise à définir les options disponibles pour réduire le risque et à les mettre en œuvre. Ce traitement implique également la capacité d'évaluer l'utilité des mesures prises, de déterminer si le risque résiduel est acceptable ou non et, dans ce dernier cas, d'envisager un traitement ultérieur.
Par conséquent, l'amélioration de la qualité des données n'est manifestement pas un objectif en soi :
- Son coût doit être évalué en fonction des objectifs de l'entreprise.
- Les traitements à mettre en œuvre doivent être évalués à travers chaque dimension de la qualité.
Obtenir notre Guide de gestion de la qualité des données pour les organisations pilotées par les données
Pour plus d'informations sur la qualité des données et la gestion de la qualité des données, téléchargez notre guide gratuit : "Guide de la gestion de la qualité des données". Télécharger l'eBook.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.