Résumé

  • Le « Data Fabric » est une approche conceptuelle qui relie et exploite métadonnées, les processus et les outils existants afin d'améliorer la gestion et l'utilisation des données.
  • Son objectif est de réduire les tâches manuelles liées aux données, de faire tomber les cloisonnements et de rendre les données plus accessibles et plus utiles à l'échelle de l'organisation.
  • Un catalogue de données un élément fondamental d'une structure de données, car il permet d'identifier, de collecter et d'organiser métadonnées.
  • Les graphes de connaissances, métadonnées et l'intégration dynamique des données contribuent à transformer cette base en un données connectées plus intelligent et plus données connectées .
  • Il n'existe pas d'outil unique permettant de mettre en place une architecture Data Fabric complète ; celle-ci doit être construite à l'aide d'outils interopérables et selon une approche progressive.

Dès 2019, Gartner avait identifié le concept de « Data Fabric » comme l'une des principales tendances technologiques pour 2022. Derrière ce terme à la mode se cache un objectif majeur : maximiser la valeur de vos données et accélérer votre transformation numérique. Découvrez comment y parvenir en suivant ce guide.

Mettre de l'ordre dans vos données, telle est la promesse d'un Data Fabric. Cependant, il ne s'agit pas simplement d'une solution d'organisation ou de structuration de l'information. Un Data Fabric est un outil conçu pour valoriser vos données. En effet, le volume de données générées par les entreprises connaît une croissance exponentielle. Chaque seconde, il y a de plus en plus de données à exploiter qui permettent aux organisations d’être plus efficaces et mieux en optimiser leur marché ou leurs clients. Les chiffres parlent d’eux-mêmes : IDC estime que d’ici 2025, le volume de données générées à l’échelle mondiale atteindra 175 zettaoctets. Un volume si important que, s’il était stocké sur des disques Blu-ray, cela représenterait une pile de disques équivalente à 23 fois la distance entre la Terre et la Lune.

Qu'est-ce que le Data Fabric ?

Gartner définit le Data Fabric comme « un concept d'architecture qui agit comme une couche intégrée de données et de processus de connexion ». En d'autres termes, un Data Fabric analyse en continu des combinaisons métadonnées existants, accessibles et déduits afin de fournir des informations plus pertinentes et support plus efficacementgestion des données . Un Data Fabric utilise ensuite l'ensemble de cette métadonnées pour concevoir de nouveaux processus et établir un accès standardisé aux données pour tous les profils professionnels au sein de l'entreprise : développeurs d'applications, analystes, data scientists, etc.

Une « Data Fabric » est donc un ensemble de processus qui lisent, collectent, intègrent et fournissent des données en tenant compte de l'identité des utilisateurs, de la classification des types d'utilisation et du suivi de l'évolution des habitudes d'utilisation des données.

Les avantages d'une architecture Data Fabric pour les entreprises

Gartner explique que d'ici 2024, le déploiement Data Fabrics au sein des organisations quadruplera l'efficacité de l'exploitation des données tout en réduisant de moitié les gestion des données effectuées par des humains. En ce sens, l'institut identifie trois principaux domaines d'opportunité offerts par un Data Fabric :

  1. Une réduction de 70 % des tâches liées découverte de données, à l'analyse et à l'intégration découverte de données pour les équipes chargées des données ;
  2. L'augmentation du nombre d'utilisateurs de données, grâce à la réutilisation des données pour un plus grand nombre de cas d'utilisation ;
  3. La capacité à tirer davantage parti d'un volume accru de données en accélérant considérablement l'intégration et l'exploitation des données secondaires et tierces.

D'un point de vue technologique, une structure de données s'adapte aux outils déjà en place au sein d'une organisation. Il peut évoluer à partir des outils d’intégration et de qualité existants, ainsi queplateformes gestion des données et gouvernance plateformes telles qu’un catalogue de données, par exemple – nous y reviendrons). En ce sens, son modèle de conception est idéal puisqu’il utilise votre technologie existante tout en poursuivant une réorientation stratégique de votre gestion des données globale gestion des données.

Enfin, une architecture Data Fabric aide les entreprises à éliminer les silos de données. Vous pouvez ainsi réduire les coûts et la charge de travail de vos équipes gestion des données , qui doivent sans cesse fusionner, restructurer et redéployer gestion des données vers de nouveaux silos.

La contribution d'un catalogue de données une structure de données

Si l'on prend la notion de « couche intégrée » issue de la définition d’un Data Fabric ainsi que le schéma proposé par Gartner (ci-dessous) comme guide, nous constatons qu’un catalogue de données un rôle fondamental dans la constitution d’un Data Fabric. En effet, il influence les couches supérieures qui forment un Data Fabric efficace.

Couche 1 – Accès à tous les types de métadonnées

Un catalogue de données le fondement d'une structure Data Fabric : il s'agit de la première couche (grise). Il permet l'identification, la collecte et l'analyse de toutes les sources de données et de tous les types de métadonnées. Le catalogue de données le point de départ d'une structure Data Fabric.

Couche 2 – métadonnées et le Knowledge Graph

Dans la deuxième couche d'une structure de données (en jaune), Garner met l'accent sur métadonnées . Cette activation implique l'analyse continue des métadonnées calculer des indicateurs clés. Cette analyse est facilitée par l'utilisation de l'intelligence artificielle (IA), de l'apprentissage automatique (ML) et de l'intégration automatisée des données.

Les modèles et les liens identifiés sont ensuite réinjectés dans le catalogue de données gestion des données autres gestion des données afin de formuler des recommandations à l'intention des personnes et des machines impliquées dans gestion des données l'intégration gestion des données . Cela nécessite une analyse continue à partir d'un graphe de connaissances connecté – un outil permettant de créer et de visualiser les relations existantes entre des ressources de données de différents types, d'en dégager une signification métier et de rendre cet ensemble de relations facile à découvrir et à explorer par tous les utilisateurs de l'organisation.

Couche 3 – Intégration dynamique des données

Le troisième niveau de Gartner (en bleu) s'adresse principalement aux utilisateurs techniques des données au sein des organisations. Ce niveau du Data Fabric fait référence à la nécessité de préparer, intégrer, explorer et transformer les données. Le défi consiste ici à rendre les ressources de données issues d’un large éventail d’outils accessibles à un large éventail d’utilisateurs professionnels. Les mots clés ici sont la flexibilité et la compatibilité pour briser les silos de données, avec les fonctionnalités suivantes :

    • Un système de gestion des autorisations d'accès aux données: le Data Fabric doit automatiser l'accès par utilisateur.
    • Provisionnement automatisé: Tout membre de l'organisation devrait pouvoir demander l'accès à un jeu de données le Data Fabric – via la création d'un ticket grâceFonctionnalités gouvernance des données intégrées.
    • Un outil d'exploration des données: Le Data Fabric devrait permettre aux utilisateurs d'explorer les données (et pas seulement métadonnées) sans avoir à quitter le Fabric.

L'orchestration automatisée des données – telle que décrite dans la partie supérieure de ce troisième niveau du schéma – fait référence à DataOps. Il s'agit d'une gestion des données collaborative gestion des données visant à améliorer la communication, l'intégration et l'automatisation des flux de données entre les gestionnaires et les utilisateurs de données au sein d'une organisation. Vous pouvez en savoir plus à ce sujet dans cet article.

Existe-t-il un outil unique pour mettre en place une structure de données ?

Comme le souligne Gartner, il n'existe aucun outil capable de prendre en charge de manière exhaustive toutes les couches de la structure. En ce sens, aucun fournisseur n'est en mesure de proposer à lui seul une structure de données pouvant être assimilée à une Data Fabric complète. La solution réside dans l’interaction entre les différentes couches. Une plateforme ouverte est la clé, et les entreprises doivent se doter des meilleurs outils de données interconnectés pour mettre en place une structure de données digne de ce nom. La mise en place d’une structure de données doit être envisagée comme un marathon, et non comme un sprint, et abordée par étapes – le catalogue de données la première.

Mise en place d'une infrastructure de données

Les entreprises qui ont adopté notre Smart catalogue de données déjà posé les bases de leur Data Fabric. En effet, outre l'identification, la collecte et l'analyse de toutes les sources de données ainsi que de tous les types de métadonnées premier niveau), la plateforme Actian Data Intelligence offre toutes les fonctionnalités nécessaires à l'activation des métadonnées son cœur de système – grâce à un graphe de connaissances (deuxième niveau). Enfin, notre catalogue couvre la troisième couche : d'une part, via l'intégration de gouvernance des données ; d'autre part, via l'application Actian Explorer qui fait office de véritable marketplace de données marketplace utilisateur marketplace chaque utilisateur métier utilisateur facilement aux jeux de données clés jeux de données l'intéressent et utilisateur créer rapidement de la valeur à partir des données disponibles.

Pour en savoir plus sur notre catalogue de données Smart, n'hésitez pas à nous contacter: