Qu'est-ce qu'une maille de données ?

Un maillage de données est une architecture informatique décentralisée qui délègue la propriété des actifs de données d'une entreprise aux départements et aux équipes qui sont les experts du domaine pour leurs données. La technologie fournit les outils nécessaires pour permettre aux experts du domaine de publier leurs propres données et les outils de connectivité nécessaires pour accéder aux produits de données publiés par d'autres. Le maillage de données utilise un modèle de données fédéré dans lequel les domaines spécialisés de l'entreprise sont les éditeurs de données pour les autres membres de l'entreprise.
Pourquoi utiliser cette architecture ?
Le problème des entrepôts de données ou des lacs de données traditionnels gérés par l'informatique centralisée est qu'ils reposent sur une équipe centrale qui n'est pas experte dans tous les domaines. L'avantage d'un maillage de données est qu'il délègue la responsabilité de la publication des données aux experts du domaine. Les fonctions commerciales et financières sont celles qui comprennent le mieux leurs ensembles de données respectifs. Elles ont besoin des outils informatiques qui leur permettent de conserver et de publier leurs données en tant que service afin que l'ensemble de l'organisation puisse avantage de données précises et de haute qualité provenant d'une source faisant autorité.
Les entrepôts et les marges de données traditionnels peuvent créer des silos de données qui sont utilisés de manière isolement par le département ou la ligne d'activité qu'ils desservent. Le problème de cette approche est qu'elle encourage la prolifération de pools de données non connectés que le reste de l'entreprise ne peut pas exploiter. Le maillage de données décourage la duplication des données, en concentrant les ressources sur un nombre réduit de sources de données de meilleure qualité parce que les experts de ces données en assurent la maintenance.
Il exploite un bus d'interopérabilité universel sur lequel se branchent les différents domaines d'activité. L'entrepôt de données du département publie ses données en tant que produit en utilisant le bus d'interopérabilité commun.
La principale différence entre un tissu de données et un maillage de données est que le tissu de données ne distribue pas la propriété des données, ce qui présente l'inconvénient de dépendre d'une équipe centrale qui peut prendre du retard.
La découvrabilité est un avantage essentiel d'un maillage de données. Les consommateurs de données peuvent rapidement localiser les données dont ils ont besoin grâce à l'utilisation abondante de métadonnées dans un maillage de données.
Les éléments constitutifs d'un maillage de données
Les éléments essentiels sont les suivants :
- Des sources de données qui pourraient être des entrepôts de données traditionnels.
- Produits de données en tant que service spécifiques à un domaine.
- L'infrastructure de données, telle que les magasins de données et les scripts, pour construire et instancier un service de produit de données.
- Normes et règles de gouvernance données.
- Contrôles et politiques de sécurité.
- Lesplateformes streaming événements telles que Kafka ou Confluent Cloud peuvent faire partie de l'infrastructure de maillage de données pour capturer et distribuer les changements de données en temps réel.
- Qualité des données et conventions de métadonnées .
- Code - y compris les pipelines de données, les contrôles de gouvernance , les politiques et les interfaces d'application.
Avantages de l'architecture de maillage de données
Les avantages d'un maillage de données sont notamment les suivants :
- Les experts du domaine partagent des données plus significatives sous la forme d'un service de produits de données.
- Le partage des sources de données existantes permet à l'entreprise d'en tirer davantage de valeur.
- La décentralisation des efforts de gestion des données permet de réduire les coûts de main-d'œuvre centralisés.
- La sécurité peut appliquer des politiques telles que le cryptage des données au repos et en mouvement.
- Les données sont plus faciles à trouver grâce aux métadonnées.
- De meilleurs produits de données libre-service.
- Moins de duplication des données.
- Moins de silos de données.
- Les projets de données peuvent être mis en place plus rapidement car il y a moins de données à déplacer et à transformer.
- Des outils, des normes et des processus partagés améliorent la maîtrise des données dans l'ensemble de l'organisation.
- Moins de retards dans les projets d'entrepôts de données grâce à la démocratisation des données.
- Les services modulaires de produits de données sont plus faciles à utiliser par les applications.
- Amélioration de la normalisation de la qualité des données et des pratiques de gouvernance données
- Les entreprises tirent davantage de valeur de leurs données, ce qui leur permet d'améliorer la prise de décision fondée sur les données.
Actian soutient les déploiements de Data Mesh
La plateforme de données Actian peut support plusieurs magasins de données qu'un maillage de données peut partager. Les instances de la plateforme peuvent être hébergées sur site ou sur plusieurs plateformes en nuage. La plateforme de données Actian dispose de centaines de connecteurs prédéfinis vers des sources telles que NetSuite, Salesforce et ServiceNow. Elle est optimisée pour des réponses rapides aux requête grâce à sa base de données vectorielle en colonnes qui surpasse les autres solutions. La plateforme de données Actian est idéale pour la mise à disposition de données avant leur publication en tant que produit de données au sein d'un domaine.