An Enterprise Data Platform (EDP) supports analytic applications by providing access to multiple data sources, such as data warehouses and data lakes. Unlike traditional enterprise data warehouses, an EDP does not try to centralize all analytical data in a single location. The EDP acts as an index for all the essential data assets in a business. The EDP catalogs data assets using metadata and hosts its own data warehouses.
Creating the Enterprise Data Platform
An EDP needs to be architected to make it easy for users to find the data and analytics they need. The EDP needs to support a role-based security access system to limit access to the assets that a particular individual or business group is authorized to view. Modern data platforms, such as the Actian Data Platform from Actian, can work with existing security frameworks, such as Active Directory, to map data sets to the user’s security role.
Le système EDP doit disposer de ses propres entrepôts de données support le chargement de données support et donnant accès aux streaming . Les données non stockées en interne, telles que certaines données semi-structurées et non structurées, doivent être accessibles via des connecteurs d'intégration de données.
Les lacs de données existants, tels que les clusters Hadoop, peuvent être connectés à l'EDP, mais celui-ci doit être capable de prendre en charge les formats de fichiers utilisés par Hadoop, tels que Parquet ORC.
Key Functions of an Enterprise Data Platform
- ingestion de données facilitent le provisionnement grâce à des connecteurs et des utilitaires tels que les chargeurs parallèles rapides.
- Le stockage des données doit prendre en charge différents formats de données en enregistrant les tables sous forme de lignes pour les applications de traitement des transactions en ligne (OLTP) et sous forme de colonnes pour les applications d'analyse de données.
- Le traitement des données offre des fonctionnalités permettant d'interroger les données, de paralléliser les opérations et de gérer cohérence simultanéité le traitement informatique.
- fonctions utilisateur . Il s'agit notamment de connecteurs vers des outils informatique décisionnelle ), d'API telles que l'ODBC (Open Database Connectivity) et de connecteurs directs vers les systèmes opérationnels.
- Le pipeline de données le transfert fluide des données depuis divers systèmes sources vers labase de données analytique.
Déploiement à grande échelle de l'EDP
Un système de traitement de données (EDP) doit support les instances de data warehouse sur site et celles basées sur le cloud. La première option peut être une exigence pour des raisons de conformité. plateformes cloud plateformes une infrastructure de calcul et de stockage élastique à la demande, capable de s'adapter à l'évolution utilisateur .
Connectivité universelle
L'EDP doit être accessible via requête SQL( Embarqué requête ) dans les applications ; des API sont donc nécessaires pour support et les langages de développement. outils bi se connecter à l'EDP pour permettre aux utilisateurs d'requête de visualiser les données analytiques.
Benefits of an Enterprise Data Platform
Below are some reasons for creating an enterprise data platform:
- Un EDP facilite la recherche d'actifs de données précieux. L'entreprise peut sélectionner les meilleures sources de données et encourager leur utilisation en les intégrant dans l'EDP.
- L'EDP optimise l'utilisation des ressources de données les plus précieuses, car davantage d'utilisateurs partagent les versions de données qu'ils privilégient plutôt que de créer leurs propres copies non gérées. L'organisation évite ainsi les coûts liés à la gestion d'un nombre de ressources supérieur aux besoins en se concentrant sur les sources de données de la plus haute qualité.
- Réduit la duplication des ensembles de données cloisonnés en favorisant la réutilisation des ressources existantes qui, sans cela, risqueraient d'être négligées.
- Une flexibilité permettant de support formats de stockage de données, ce qui apporte une valeur ajoutée aux investissements existants dans le Big Data et les entrepôts de données. L'EDP n'impose pas le remplacement pur et simple des entrepôts de données existants. À mesure que les systèmes sont modernisés, ils peuvent être intégrés à l'EDP en tant que référentiels de premier niveau.
- Cela permet d'améliorer la conformité réglementaire, car le responsable du traitement des données peut mettre en œuvre les mesures de sécurité appropriées.
- Permet déploiement plus rapide déploiement nouvelles sources de données en utilisant les instances existantes comme modèles.
- Jette les bases des initiatives liées au « data mesh au « data fabric ». Le « data mesh » et le « data fabric » contribuent tous deux à améliorer la qualité des ressources de données et à réduire les coûts de gestion.
Leveraging Actian as an Enterprise Data Platform
Below are some key features that make the Actian Data Platform a solid foundation for an EDP:
- Des connecteurs intégrés permettant de se connecter à des centaines de sources de données.
- Planificateur pour pipeline de données .
- stockage en colonnes les tables de relations, afin d'éviter le recours aux index de base de données traditionnels.
- Support formats de données externes, y compris Hadoop Spark.
- requête distribué requête .
- Traitement vectoriel sur des processeurs grand public.
- Mise en place d'un cloud hybride.
- supportmulti-cloud.
- Programmation d'API et intégration d'outils de BI.
Une vue d'ensemble centralisée des données dispersées
The enterprise data platform can deploy data warehouses on-premise and in cloud environments and uses features such as a data catalog, distributed queries, and data connectors to external data sources to simplify navigation to distributed data.
pipeline de données
Les sources de données opérationnelles évoluant au fil du temps, les pipelinesETL(Extract Transform Load) peuvent être utilisés pour actualiser les entrepôts de données gérés par l'EDP. Les données entrantes peuvent être transformées, filtrées et normalisées avant d'être stockées dans les entrepôts de données auxquels l'EDP est connecté. L'ELT (Extract Load Transform) offre une alternative à l'ETL, dans laquelle les données téléchargées sont nettoyées et transformées selon les besoins au sein d'un entrepôt de données. La technologied'intégration de données permet de gérer des pipelines de données complets, depuis les connecteurs prédéfinis jusqu'aux fonctions de planification pour l'exécution des scripts de pipeline. Une technologie d'intégration de données plus complète permettra une surveillance à l'échelle de l'entreprise des pipelines de données, avec la possibilité de vérifier les opérations, de relancer les scripts ayant échoué et d'alerter en cas de problème.
Actian et la plateforme d'intelligence des données
La plateformeActianData Intelligencea été spécialement conçue pour aider les organisations à unifier, gérer et comprendre leurs données dans des environnements hybrides. Elle regroupe métadonnées , gouvernance, la traçabilité, le contrôle de la qualité et l'automatisation au sein d'une seule et même plateforme. Cela permet aux équipes de savoir d'où proviennent les données, comment elles sont utilisées et si elles répondent aux exigences internes et externes.
Grâce à son interface centralisée, Actian offre insight en temps réel insight les structures et les flux de données, ce qui facilite l'application des politiques, la résolution des problèmes et la collaboration entre les services. La plateforme aide également à replacer les données dans leur contexte métier, permettant ainsi aux équipes de les exploiter de manière plus efficace et responsable. La plateforme Actian est conçue pour s'adapter à l'évolution des écosystèmes de données, garantissant une utilisation cohérente, intelligente et sécurisée des données à l'échelle de l'entreprise.Demandez votre démonstration personnalisée.
Points clés à retenir

FAQ
Une plateforme de données d'entreprise (EDP) prend en charge les applications analytiques en donnant accès à de multiples sources de données, telles que les entrepôts de données et les lacs de données, et en servant d'index pour les ressources de données essentielles plutôt que de centraliser toutes les données en un seul endroit.
Contrairement aux entrepôts de données traditionnels qui centralisent toutes les données analytiques en un seul endroit, un EDP répertorie les ressources de données à l'aide de métadonnées permet d'accéder à des sources de données distribuées tout en hébergeant ses propres entrepôts de données.
Parmi les principales fonctionnalités, on peut citer ingestion de données des connecteurs et des chargeurs parallèles, le stockage des données dans divers formats, le traitement des données pour les requêtes et la parallélisation, utilisateur telles que les connecteurs BI et les API, ainsi que les pipelines de données pour un flux de données ordonné.
Une plateforme de gestion des données d'entreprise (EDP) facilite la recherche des ressources de données, optimise l'utilisation des sources de données stratégiques, réduit les doublons dans les silos, prend en charge divers formats de stockage, améliore la conformité réglementaire et permet déploiement plus rapide déploiement nouvelles sources de données.
Oui, une solution EDP doit support les instances de data warehouse sur site et support basées sur le cloud, plateformes cloud plateformes une évolutivité élastique en termes de puissance de calcul et de stockage, tandis que les options sur site répondent aux exigences de conformité.
Une plateforme EDP se connecte à diverses sources, notamment des entrepôts de données, des lacs de données et des clusters Hadoop, et prend en charge différents formats de données, tels que les tables structurées, les données semi-structurées et les formats de fichiers comme Parquet ORC.
L'EDP prend en charge les systèmes d'accès sécurisé basés sur les rôles afin de limiter l'accès en fonction des niveaux d'autorisation et peut s'intégrer à frameworks de sécurité existantes frameworks Active Directory pour associer des ensembles de données à des rôles utilisateur .
Les pipelines ETL transforment, filtrent et normalisent les données avant de les stocker dans des entrepôts de données, tandis que les processus ELT chargent d'abord les données, puis les nettoient et les transforment selon les besoins au sein même de l'entrepôt de données.