coffre-fort de données

Groupe de professionnels discutant de stratégies de coffre-fort de données autour d'un ordinateur portable dans un bureau moderne.

Un coffre-fort de données est une méthodologie d'organisation des données analytiques qui englobe le stockage des données brutes, les règles d'entreprise pour support transformation des données brutes et les marts de données multiples. L'architecture coffre-fort de données répond aux lacunes inhérentes aux solutions alternatives, notamment la3e forme normale, les entrepôts de données d'entreprise et les approches de conception dimensionnelle.

Un coffre-fort de données utilise une structure spécifique qui s'articule autour de trois éléments principaux : les hubs, les liens et les satellites. Voici une description de chacun de ces éléments :

Hubs: Ces tables stockent des entités commerciales essentielles telles que des clients, des produits ou des lieux. Elles contiennent un identifiant unique (clé de gestion) et des attributs descriptifs minimaux qui ne sont pas susceptibles de changer fréquemment.

Liens: Ces tables représentent les relations entre les hubs. Elles contiennent des clés étrangères qui renvoient aux clés de gestion des plateformes connectées. Les liens fournissent un contexte sur la manière dont les entités sont associées les unes aux autres.

Satellites: Ces tableaux contiennent des données détaillées associées aux concentrateurs ou aux liaisons. Elles comprennent divers attributs descriptifs qui peuvent changer au fil du temps. Il est important de noter que les satellites contiennent également des métadonnées telles que la source des données et la date de chargement, ce qui permet un suivi historique.

Pourquoi un coffre-fort de données est-il important ?

Le coffre-fort de données offre une approche plus souple de l'entreposage de données que la3e forme normale (3NF) et la conception dimensionnelle traditionnelles en conservant les données brutes d'origine, ce qui facilite l'audit des modifications au fil du temps. Le coffre-fort des règles métier stocke les transformations, les filtres ou les calculs qui peuvent être facilement modifiés ou étendus, et les marts de données sont simplement des vues et quelques tables optionnelles qui les rendent faciles à modifier.

La structure du coffre-fort de données permet à une organisation de commencer modestement en utilisant un petit nombre d'ensembles de données brutes et d'augmenter progressivement au fur et à mesure de l'évolution des besoins de l'entreprise. La disponibilité immédiate du coffre-fort de données brutes permet de clarifier l'historique des données. Globalement, cette approche est plus adaptée lorsque les objectifs de l'entreprise changent souvent et que vous avez besoin d'un contrôle de version intégré.

Les avantages de la conception d'un coffre-fort de données

Les conceptions de coffre-fort de données offrent plusieurs avantages par rapport aux approches traditionnelles d'entrepôt de données:.

Flexibilité

La structure d'un coffre-fort de donnéesest conçue pour être adaptable. De nouvelles sources de données et de nouveaux champs peuvent être incorporés facilement sans impact sur le modèle existant, contrairement aux modèles dimensionnels traditionnels qui nécessitent un remaniement important pour les changements.

Évolutivité

Les chambres fortes sont conçues pour gérer des volumes de données croissants. Leur conception modulaire permet une extension facile au fur et à mesure que les besoins en stockage de données augmentent.

Lignage des données

Les coffres-forts de données excellent dans le suivi de l'historique de vos données. Chaque enregistrement est préservé, avec des drapeaux indiquant les changements survenus au fil du temps. Cet aspect est crucial pour la conformité réglementaire et l'audit.

Chargement plus rapide

Les architectures coffre-fort de données permettent souvent le chargement parallèle des données en raison de l'absence de relations complexes entre les tables. Cela peut améliorer considérablement la vitesse d'ingestion de données .

Processus ETL simplifiés

Le coffre-fort de données ne nécessitant pas de pré-modélisation des données, le processus d'extraction, de transformation et de chargement(ETL) est rationalisé. Cela réduit le temps de développement et les efforts de maintenance.

La plateforme de données Actian et le coffre-fort de données

La plateforme de données Actian peut héberger un schéma de coffre-fort de données avec un dépôt pour stocker les données brutes avec un formatage minimal, un deuxième ensemble de tables contenant les règles de gestion avec les données de lignage, et plusieurs marts de données contenant des vues et des tables qui analysent l'accès de l'utilisateur . La base de données vectorielle en colonnes fournit des fonctions SQL pour appliquer des filtres et des transformations aux tables de données brutes. Cette fonctionnalité s'apparente à l'utilisation des Fonctionnalités ELT (Extraction, Chargement et Transformation).

Les marges de données qui en résultent peuvent être reliées à des solutions informatique décisionnelle pour faciliter l'analyse et la visualisation des données. La base de données Vector offre des de haute performance grâce à des fonctionnalités telles que les requêtes parallèles vectorisées qui exploitent l'accélération au niveau de la puce pour assurer le multithreading entre les cœurs et la mise en cache entre les processeurs.

FAQ

Un « coffre-fort de données » coffre-fort de données une méthodologie d'organisation des données analytiques qui englobe le stockage des données brutes, les règles métier support transformation, ainsi que plusieurs entrepôts de données, le tout selon une structure articulée autour de nœuds centraux, de liaisons et de nœuds périphériques.

Les hubs stockent les entités métier principales avec des identifiants uniques, les liens représentent les relations entre les hubs, et les satellites contiennent des données détaillées et métadonnées évoluer au fil du temps, avec Fonctionnalités de suivi historique.

Contrairement aux approches traditionnelles de la troisième forme normale et de la conception dimensionnelle, un coffre-fort de données les données brutes d'origine pour faciliter l'audit, stocke les règles métier séparément pour plus de flexibilité et utilise les data marts comme des vues faciles à modifier lorsque les objectifs métier évoluent.

Les data vaults offrent la flexibilité nécessaire pour ajouter de nouvelles sources sans affecter les modèles existants, évolutivité leur conception modulaire, une traçabilité complète des données pour la conformité, un chargement parallèle plus rapide et des processus ETL simplifiés qui réduisent les délais de développement.

Les coffres de données conservent chaque enregistrement marqueurs indiquant les modifications apportées au fil du temps, ce qui rend la traçabilité des données claire et essentielle à des fins de conformité réglementaire et d'audit.

Oui, coffre-fort de données permet aux organisations de commencer avec un petit nombre d'ensembles de données brutes et de se développer progressivement à mesure que leurs besoins évoluent.

La plateforme de données Actian coffre-fort de données comprenant des référentiels de données brutes, des tables de règles métier avec des données de traçabilité, ainsi que plusieurs data marts, tandis que la base de données vectorielle en colonnes offre des fonctions SQL pour les filtres et les transformations, avec des requêtes parallèles de haute performance .