La curation de données : Indispensable pour valoriser vos données
Actian Corporation
24 août 2021

Il ne suffit pas d'avoir de gros volumes de données : c'est ce que vous en faites qui compte. Pour tirer le meilleur parti de vos données, vous devez distiller une véritable culture de la donnée au sein de votre entreprise. Le fondement de cette culture est la curation des données.
0 % des données mondiales ont été créées au cours des deux dernières années. Avec la croissance exponentielle des appareils connectés, les entreprises seront confrontées à la triste réalité que notre capacité à créer des données dépassera de loin notre capacité à les gérer et à les exploiter.
Et cela ne va pas s'arranger ! Selon les estimations publiées dans le Digital Economy Compass 2020 de Statista, le volume annuel de données numériques créées dans le monde a été multiplié par plus de 20 au cours de la dernière décennie et dépassera la barre des 50 zettaoctets d'ici à 2021.
Dans ce contexte, il n'est pas surprenant que la plupart des entreprises ne soient actuellement en mesure d'analyser que 12 % des données dont elles disposent. Car derrière la collecte, le stockage et la sécurité des données, il y a avant tout la valeur commerciale qui peut en être tirée.
C'est le défi auquel répond le concept de curation des données : l'étape essentielle pour exploiter le potentiel de l'abondant patrimoine de données d'une organisation.
La définition de la conservation des données
Selon la définition donnée par l'INIST (Institut de l'Information Scientifique et Technique), rattaché au CNRS,
"La conservation fait référence à toutes les activités et opérations nécessaires à la gestion active des données de recherche numériques, tout au long de leur cycle de vie. L'objectif est de les rendre accessibles, partageables et réutilisables de manière durable. Trois parties prenantes peuvent être identifiées dans le cycle de vie des données : les créateurs, le plus souvent des chercheurs, les "conservateurs" et les utilisateurs".
En d'autres termes, la curation de données est une tâche qui consiste à identifier dans un catalogue de données celles qui peuvent être valorisées et exploitées et, dans un second temps, à les mettre à la disposition des utilisateurs susceptibles d'en tirer les meilleurs enseignements.
Pour mettre en place une curation de données efficace et pertinente, il faut commencer par une cartographie précise des données disponibles. Cette cartographie initiale est la base d'une gouvernance données pragmatique et opérationnelle.
Une fois les règles de gouvernance établies, c'est vers l'utilisateur données que toute l'attention doit se porter. La donnée est un minerai qui n'a de valeur que si elle est correctement valorisée. Cette valorisation doit être pensée comme une réponse aux besoins de l'utilisateur. C'est ce dernier qui est à l'origine du projet de curation de données.
Un processus itératif et continu pour l'exploitation des donnéesUn processus itératif et continu d'exploitation des données, distinct de toutes les tâches essentielles à la gouvernance données (de la gestion de la qualité à la protection des données et même à la gestion du cycle de vie des données).
La curation de données : Des conditions essentielles, des avantages indéniables
La curation de données est une perspective de développement rapide et massif d'une culture de données au sein d'une organisation.
La mise en place d'une stratégie de gestion des données et de curation permet de faire le point sur les données produites. Il est alors possible de sélectionner les données les plus pertinentes et de les enrichir des métadonnées nécessaires à leur compréhension et à leur réutilisation, y compris par les utilisateurs métiers.
Chacun dans l'entreprise peut alors fonder ses choix, ses décisions, ses stratégies et ses méthodes sur l'utilisation systématique des données, sans devoir disposer de compétences spécifiques.
L'objectif : Créer les conditions d'une utilisation systématique des données comme base de tout projet ou approche, et ne pas limiter leur utilisation à la Data Science ou aux équipes d'experts en données.
Pour déployer efficacement votre stratégie de curation de données, vous devez donc vous appuyer sur des éléments essentiels à la bonne gestion de votre patrimoine de données. Le cœur du réacteur ne se limite pas aux catalogues de données.
Si elles sont essentielles et découlent directement de votre carte de données, métadonnées gouvernance joue un rôle encore plus crucial. métadonnées facilite l'interaction des utilisateurs avec les portefeuilles de données en langage naturel.
Avec la curation de données, entrez définitivement dans une dynamique axée sur les données.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.