Plateforme de données

Plate-forme de données d'entreprise

Une solide plateforme de données multicouches

Une plateforme de données d'entreprise (EDP) prend en charge les applications analytiques en fournissant un accès à de multiples sources de données, telles que les entrepôts de données et les lacs de données. Contrairement aux entrepôts de données d'entreprise traditionnels, l'EDP n'essaie pas de centraliser toutes les données analytiques en un seul endroit. L'informatique fait office d'index pour toutes les données essentielles d'une entreprise. L'informatique catalogue les données à l'aide de métadonnées et héberge ses propres entrepôts de données.

Création de la plate-forme de données d'entreprise

L'architecture d'un système informatique doit permettre aux utilisateurs de trouver facilement les données et les analyses dont ils ont besoin. L'informatique doit support un système d'accès sécurisé basé sur les rôles afin de limiter l'accès aux actifs qu'une personne ou un groupe d'entreprises est autorisé à consulter. Les plateformes données modernes telles que la La plateforme de données Actian d'Actian peut fonctionner avec des cadres de sécurité existants tels qu'Active Directory pour faire correspondre les ensembles de données au rôle de sécurité de l'utilisateur.

L'informatique doit disposer de ses propres entrepôts de données qui support chargement des données par lots et permettent l'accès aux données streaming . Les données non stockées en interne, telles que certaines données semi-structurées et non structurées, doivent être accessibles via des connecteurs d'intégration de données.

Les lacs de données existants, tels que les clusters Hadoop, peuvent être connectés à l'EDP, mais l'EDP doit pouvoir accéder aux formats de fichiers utilisés par Hadoop, tels que Parquet et ORC.

Fonctions clés d'une plateforme de données d'entreprise

  • les fonctions d'ingestion de données facilitent l'approvisionnement avec des connecteurs et des utilitaires tels que les chargeurs rapides parallèles.
  • Le stockage des données doit gérer différents formats de données en stockant les tables sous forme de lignes pour les applications de traitement des transactions en ligne (OLTP) et sous forme de colonnes pour les applications d'analyse des données.
  • Le traitement des données fournit les fonctions d'interrogation des données, de parallélisation des opérations et de gestion de la cohérence et de la simultanéité pour l'informatique.
  • les fonctions d'interface utilisateur . Il s'agit notamment de connecteurs vers des outils d'informatique décisionnelle (BI), d'API telles que Open Database Connectivity (ODBC), et de connecteurs directs vers des systèmes opérationnels.
  • Le pipeline de données est responsable du flux ordonné des données provenant des différents systèmes sources vers la base de données analytique.

Développer l'EDP

Un système informatique doit support instances d'entrepôts de données hybrides sur site et dans le nuage. La première solution peut être exigée pour des raisons de conformité. Les plateformes en nuage offrent une infrastructure de calcul et de stockage élastique et évolutive à la demande pour suivre les charges des utilisateur au fur et à mesure qu'elles augmentent.

Connectivité universelle

L'informatique doit être accessible à partir du langageSQL ( Embarqué Structured requête Language) dans les applications, et des API sont donc nécessaires pour support scripts et les langages de développement. Les outils bi doivent se connecter à l'informatique pour permettre aux utilisateurs de requête et de visualiser des données analytiques.

Avantages d'une plate-forme de données d'entreprise

Voici quelques raisons de créer une plateforme de données d'entreprise :

  • L'informatique facilite la recherche de données précieuses. L'entreprise peut sélectionner les meilleures sources de données et encourager leur utilisation en les incluant dans l'EDP.
  • L'informatique augmente l'utilisation des données les plus précieuses, car davantage d'utilisateurs partagent les versions préférées des données au lieu de créer leurs propres copies non gérées. Le coût de la maintenance d'un plus grand nombre d'actifs que nécessaire est évité en concentrant l'organisation sur les sources de données de la plus haute qualité.
  • Réduit la duplication des ensembles de données en silos en favorisant la réutilisation des actifs existants qui pourraient autrement être négligés.
  • Flexibilité pour support plusieurs formats de stockage de données, ajoutant de la valeur aux investissements existants en matière de big data et d'entrepôts de données. L'informatique n'impose pas le remplacement intégral des entrepôts de données existants. Au fur et à mesure que les systèmes sont modernisés, ils peuvent être inclus en tant que référentiels de premier niveau dans l'informatique.
  • Il améliore la conformité réglementaire car l'informatique peut appliquer les contrôles de sécurité appropriés.
  • Permet un déploiement plus rapide de nouvelles sources de données en utilisant les instances existantes comme modèles.
  • Crée une base pour les initiatives de maillage de données et de tissu de données. Les maillages de données et les tissus de données contribuent à améliorer la qualité des données et à réduire les coûts de gestion.

Tirer parti d'Actian en tant que plate-forme de données d'entreprise

Voici quelques caractéristiques clés qui font de la plateforme de données Actian un outil de travail efficace. La plateforme de données Actian une base solide pour un EDP :

  • Connecteurs intégrés à des centaines de sources de données.
  • Planificateur pour les opérations de pipeline de données .
  • stockage en colonnes pour les tables de relations afin d'éliminer le besoin d'index de base de données traditionnels.
  • Support des formats de données externes, y compris Hadoop Spark.
  • Traitement des requête distribuées.
  • Traitement vectoriel sur des processeurs de base.
  • Approvisionnement en nuages hybrides.
  • supportmulti-cloud.
  • Programmation d'API et d'intégrations d'outils de BI.

Visibilité centrale pour les données distribuées

La plateforme de données d'entreprise peut déployer des entrepôts de données sur site et dans des environnements en nuage et utilise des fonctionnalités telles qu'un catalogue de données, des requêtes distribuées et des connecteurs de données vers des sources de données externes pour simplifier la navigation dans les données distribuées.

pipeline de données

Comme les sources de données opérationnelles changent au fil du temps, les pipelines d'extraction, de transformation et de chargement(ETL) peuvent être utilisés pour rafraîchir les entrepôts de données gérés par l'EDP. Les données entrantes peuvent être transformées, filtrées et normalisées avant d'être stockées dans les entrepôts de données auxquels l'EDP est connecté. L'extraction, le chargement et la transformation (ELT) constituent une alternative à l'ETL, où les données chargées sont nettoyées et transformées selon les besoins dans un entrepôt de données. La technologie d'intégration des données peut gérer des pipelines de données complets, depuis les connecteurs prédéfinis jusqu'aux fonctions de planification pour l'exécution des scripts de pipeline. Une technologie d'intégration de données plus complète permettra de surveiller les pipelines de données à l'échelle de l'entreprise, avec la possibilité de vérifier les opérations, de relancer les scripts qui ont échoué et d'alerter en cas de problème.

Principaux enseignements

plate-forme de données d'entreprise