coffre-fort de données
                Un coffre-fort de données est une méthodologie d'organisation des données analytiques qui englobe le stockage des données brutes, les règles d'entreprise pour support transformation des données brutes et les marts de données multiples. L'architecture coffre-fort de données répond aux lacunes inhérentes aux solutions alternatives, notamment la3e forme normale, les entrepôts de données d'entreprise et les approches de conception dimensionnelle.
Un coffre-fort de données utilise une structure spécifique qui s'articule autour de trois éléments principaux : les hubs, les liens et les satellites. Voici une description de chacun de ces éléments :
Hubs: Ces tables stockent des entités commerciales essentielles telles que des clients, des produits ou des lieux. Elles contiennent un identifiant unique (clé de gestion) et des attributs descriptifs minimaux qui ne sont pas susceptibles de changer fréquemment.
Liens: Ces tables représentent les relations entre les hubs. Elles contiennent des clés étrangères qui renvoient aux clés de gestion des plateformes connectées. Les liens fournissent un contexte sur la manière dont les entités sont associées les unes aux autres.
Satellites: Ces tableaux contiennent des données détaillées associées aux concentrateurs ou aux liaisons. Elles comprennent divers attributs descriptifs qui peuvent changer au fil du temps. Il est important de noter que les satellites contiennent également des métadonnées telles que la source des données et la date de chargement, ce qui permet un suivi historique.
Pourquoi un coffre-fort de données est-il important ?
Le coffre-fort de données offre une approche plus souple de l'entreposage de données que la3e forme normale (3NF) et la conception dimensionnelle traditionnelles en conservant les données brutes d'origine, ce qui facilite l'audit des modifications au fil du temps. Le coffre-fort des règles métier stocke les transformations, les filtres ou les calculs qui peuvent être facilement modifiés ou étendus, et les marts de données sont simplement des vues et quelques tables optionnelles qui les rendent faciles à modifier.
La structure du coffre-fort de données permet à une organisation de commencer modestement en utilisant un petit nombre d'ensembles de données brutes et d'augmenter progressivement au fur et à mesure de l'évolution des besoins de l'entreprise. La disponibilité immédiate du coffre-fort de données brutes permet de clarifier l'historique des données. Globalement, cette approche est plus adaptée lorsque les objectifs de l'entreprise changent souvent et que vous avez besoin d'un contrôle de version intégré.
Les avantages de la conception d'un coffre-fort de données
Les conceptions de coffre-fort de données offrent plusieurs avantages par rapport aux approches traditionnelles d'entrepôt de données:.
Flexibilité
La structure d'un coffre-fort de donnéesest conçue pour être adaptable. De nouvelles sources de données et de nouveaux champs peuvent être incorporés facilement sans impact sur le modèle existant, contrairement aux modèles dimensionnels traditionnels qui nécessitent un remaniement important pour les changements.
Évolutivité
Les chambres fortes sont conçues pour gérer des volumes de données croissants. Leur conception modulaire permet une extension facile au fur et à mesure que les besoins en stockage de données augmentent.
Traçabilité des données
Les coffres-forts de données excellent dans le suivi de l'historique de vos données. Chaque enregistrement est préservé, avec des drapeaux indiquant les changements survenus au fil du temps. Cet aspect est crucial pour la conformité réglementaire et l'audit.
Chargement plus rapide
Les architectures coffre-fort de données permettent souvent le chargement parallèle des données en raison de l'absence de relations complexes entre les tables. Cela peut améliorer considérablement la vitesse d'ingestion de données .
Processus ETL simplifiés
Le coffre-fort de données ne nécessitant pas de pré-modélisation des données, le processus d'extraction, de transformation et de chargement(ETL) est rationalisé. Cela réduit le temps de développement et les efforts de maintenance.
La plateforme de données Actian et le coffre-fort de données
La plateforme de données Actian peut héberger un schéma de coffre-fort de données avec un dépôt pour stocker les données brutes avec un formatage minimal, un deuxième ensemble de tables contenant les règles de gestion avec les données de lignage, et plusieurs marts de données contenant des vues et des tables qui analysent l'accès de l'utilisateur . La base de données vectorielle en colonnes fournit des fonctions SQL pour appliquer des filtres et des transformations aux tables de données brutes. Cette fonctionnalité s'apparente à l'utilisation des capacités ELT (Extraction, Chargement et Transformation).
Les marges de données qui en résultent peuvent être reliées à des solutions informatique décisionnelle pour faciliter l'analyse et la visualisation des données. La base de données Vector offre des de haute performance grâce à des fonctionnalités telles que les requêtes parallèles vectorisées qui exploitent l'accélération au niveau de la puce pour assurer le multithreading entre les cœurs et la mise en cache entre les processeurs.