Intelligence des données

Utilisation de la plateforme Actian Data Intelligence : guide de niveau intermédiaire

Utilisation de la plateforme d'intelligence des données Actian : guide de niveau intermédiaire

Ce guide s'adresse aux utilisateurs intermédiaires de la plateforme Actian Data Intelligence. Il n'est pas destiné aux débutants ni métadonnées chevronnés métadonnées .  

En tant utilisateur intermédiaire, vous comprenez déjà les principes de base de la gouvernance des données et des catalogues de données, mais vous souhaitez passer au niveau supérieur en utilisant la plateforme Actian. Dans ce guide, nous passerons en revue l'architecture et les concepts fondamentaux, déploiement la configuration, les workflows quotidiens, les utilisations avancées et les meilleures pratiques. Vous serez en mesure d'optimiser la plateforme pour découvrir vos données, avoir confiance en leur qualité et activer vos actifs de données.  

Présentation de la plateforme et concepts fondamentaux

Tout d'abord, clarifions ce qu'est la Actian Data Intelligence Platform , en quoi elle diffère des autres outils et les concepts clés que vous utiliserez. 

Qu'est-ce que la plateforme ?

Actian Data Intelligence Platform est une solution cloud native à l'échelle de l'entreprise pour métadonnées , le catalogage des données, la traçabilité des données, gouvernance des données et la mise en place d'une marketplace des données. Elle s'appuie sur un graphe de connaissances fédéré et utilise un serveur MCP (Model Context Protocol) pour cartographier les relations entre les actifs de données, simplifier découverte de données et donner un contexte aux données en fonction de l'état de votre entreprise.  

En quoi diffère-t-il d'un catalogue de données de base ?

Contrairement aux catalogues de données traditionnels, la plateforme Actian : 

  • Combine métadonnées, la qualité et observabilité des données, gouvernance, le contexte commercial et la découverte dans une seule solution.
  • Utilise un graphique de connaissances , reliant métadonnées techniques métadonnées que les tableaux et les colonnes au contexte commercial, y compris les termes du glossaire et les indicateurs clés de performance, et cartographiant les relations entre les données.
  • Prend en charge un modèle de produit de données, dans lequel jeux de données publiés dans un marketplace de données, avec des contrats, des politiques, des demandes d'accès et d'autres détails en place.
  • Se déploie dans des environnements hybrides ou multicloud et peut évoluer à travers les domaines et les équipes.

Terminologie à connaître

 Voici les termes que vous rencontrerez : 

  • métadonnées . Capture et gestion métadonnées techniques et commerciales métadonnées votre écosystème de données, y compris les sources de données, les rapports, les tableaux de bord et outils bi. 
  • catalogue de données découverte de données. Permettre aux utilisateurs des équipes techniques et commerciales de rechercher, d'explorer et de comprendre jeux de données. 
  • Graphique de connaissances et couche sémantique. Représentation des relations entre les ressources de données, les domaines, les termes commerciaux et la lignée. Cela sous-tend la découverte et le contexte. 
  • gouvernance des données. Politiques, rôles, contrôles d'accès, contrats et mécanismes de conformité qui garantissent une utilisation fiable des données. 
  • Data products marketplace. Actifs de données publiés et gérés, accompagnés de documentation, de contrats et accessibles aux utilisateurs professionnels. 
  • Lignée et observabilité. Suivi du flux des données depuis leur ingestion jusqu'à leur consommation, en passant par leur transformation, et contrôle de la qualité et de l'intégrité des données tout au long du processus.  

déploiement configuration : meilleures pratiques

Avant de vous lancer dans l'utilisation quotidienne de la plateforme, vous devez disposer d'une base solide. Voici quelques considérations relatives déploiement à la configuration de niveau intermédiaire : 

4 étapes pour l'architecture et l'aménagement du territoire

  1. Choisissez votre déploiement. Décidez si vous utiliserez la version SaaS/cloud ou un déploiement sur site. La plateforme prend en charge les environnements hybrides et multi-cloud. 
  2. Cartographiez votre écosystème de données. Déterminez quelles sont les sources existantes, telles que les bases de données, les lacs de données, outils bi et les applications SaaS. Décidez également comment les domaines sont définis, que ce soit par unité commerciale, région ou capacité, et qui est responsable des tâches liées aux données. 
  3. Prévoyez la connectivité. Assurez-vous que la plateforme peut se connecter à vos sources pour métadonnées , l'analyse et la traçabilité métadonnées .  
  4. Définir les modèles d'accès et de sécurité. Ceux-ci comprennent utilisateur , la séparation des tâches, gouvernance fédérée ou centralisée, et l'autonomie des domaines ou l'alignement de l'entreprise. 

7 étapes pour la configuration et l'intégration

  1. Installez/configurez la plateforme. Configurez-la pour les environnements cloud ou sur site, configurez l'authentification (LDAP/AD/SAML) et définissez les utilisateurs administrateurs initiaux. 
  2. Définissez les domaines et la structure. Établissez des domaines de données. Il peut s'agir, par exemple, des ventes, des finances ou des opérations, puis créez des partitions ou des sous-catalogues de domaine selon les besoins. Cela permet une décentralisation de la propriété des données. 
  3. Connectez vos métadonnées . Configurez les scanners intégrés/intégrations API pour ingérer métadonnées vos bases de données, entrepôts de données, outils bi, fichiers, lacs de données et autres sources. La plateforme les cataloguera automatiquement. 
  4. Définissez le glossaire et la taxonomie de l'entreprise. Faites appel aux responsables métier et aux propriétaires de domaine pour définir les termes clés, les définitions, les indicateurs et les KPI de votre organisation. Ceux-ci seront utilisés par le graphe de connaissances et faciliteront la découverte et la compréhension. 
  5. data products contrats relatifs data products documentaires. Commencez à publier jeux de données à forte valeur ajoutée jeux de données data products. Définissez métadonnées, les politiques, les contrôles d'accès et les contrats. Cela vous aidera à mettre en place libre-service découverte de données vos équipes. 
  6. Activer la traçabilité et observabilité des données. Vérifiez que la capture de la traçabilité fonctionne et intégrez vos observabilité de qualité et observabilité des données afin que les utilisateurs puissent avoir confiance en vos données. 
  7. Intégrer les utilisateurs et fournir apprentissage.entraîner les gestionnaires entraîner , les ingénieurs et les utilisateurs professionnels à l'optimisation de la plateforme. 

Flux de travail quotidiens

Nous allons maintenant voir comment vous et votre équipe allez utiliser la plateforme sur le plan opérationnel, en l'intégrant à vos flux de travail. 

Découverte de données

Pour les utilisateurs professionnels et data analysts, ces Fonctionnalités découverte de données Fonctionnalités essentielles : 

  • Effectuez des recherches à l'aide de langage naturel ou de mots-clés dans jeux de données, les rapports, les tableaux de bord et les définitions du glossaire. La technologie des graphes de connaissances fournit un contexte sémantique.
  • Parcourez les informations de votre organisation, comme sur une marketplace de données.
  • Évaluez jeu de données . Avant d'utiliser les données, examinez leur provenance, les indicateurs de qualité, leur propriété ou le contexte du glossaire métier. Cela renforce la confiance et réduit les retouches.
  • Soumettez les demandes d'accès aux jeux de données la marketplace des données marketplace un libre-service , afin de rationaliser la consommation tout en préservant gouvernance.

Gestionnaires de données et ingénieurs

Le côté « producteur » est celui où vous, en tant utilisateur intermédiaire, passerez du temps à maintenir et enrichir les métadonnées, à assurer gouvernance et à publier data products. Voici quelques tâches que vous effectuerez :  

  • Utilisez les outils d'analyse de la plateforme pour ingérer automatiquement métadonnées, garantir une traçabilité robuste des données et classer les données.
  • Enrichissez métadonnées à votre guise. Ajoutez des termes commerciaux, des définitions, des balises de domaine, des classifications de sensibilité, des propriétaires et des notes d'utilisation.
  • Définissez data contracts des accords de niveau de service (SLA) pour data products. La plateforme prend en charge les approches axées sur les contrats.
  • Gérer gouvernance , y compris les approbations pour la publication, jeu de données et métadonnées . Cela permet d'activer et de maintenir les pistes d'audit.
  • Surveillez la traçabilité. Visualisez le flux de données depuis la source jusqu'au rapport, comprenez les dépendances et l'impact des changements, et identifiez les transformations potentiellement risquées ou goulots d’étranglement.

Data Products

L'une des fonctionnalités les plus avancées de la plateforme consiste à transformer jeux de données data products de premier ordre data products sont publiés sur une marketplace votre organisation. C'est là que les mondes commercial et technique se rencontrent. 

  • Vous ou vos équipes chargées des données identifiez jeux de données à forte valeur ajoutée, tels que les résumés mensuels des ventes, la segmentation de la clientèle ou les données budgétaires des centres de coûts, et les publiez sous forme de data products.
  • Pour chaque produit, définissez :  
    • métadonnées. La description, le domaine, le propriétaire et le gestionnaire. 
    • Politiques. Qui peut accéder au produit de données, à quelle fréquence il est actualisé et les indicateurs de qualité. 
    • Documentation. Contexte commercial, utilisations courantes et mises en garde connues. 
  • Placez le produit sur le marketplace les utilisateurs professionnels peuvent facilement le trouver via une recherche, une navigation ou une recommandation.
  • Du côté de la consommation, les utilisateurs trouvent le produit, évaluent sa fiabilité, demandent l'accès et commencent à l'utiliser.
  • Surveillez l'utilisation du produit. Suivez le nombre d'utilisateurs qui y ont accédé, les ressources en aval qui en découlent, recevez des commentaires et observez l'évolution du produit.

Fonctionnalités avancées de la plateforme Actian Data Intelligence

Une fois que vous maîtrisez les workflows standard, vous pouvez exploiter les fonctionnalités avancées et à forte valeur ajoutée de la plateforme. 

Graphique de connaissances et recherche sémantique

Le graphe de connaissances de la plateforme relie jeux de données, les colonnes, les termes métier, les propriétaires, les domaines, les transformations et les rapports. Associé au serveur MCP, il vous offre un contexte sémantique et une découverte plus riche.  

Par exemple, lorsqu'un utilisateur professionnel utilisateur « taux de désabonnement des clients », la plateforme renvoie non seulement jeux de données « customer_churn », mais également des termes associés tels que « attrition » et « customer_retention ». Elle affiche également la lignée, le domaine et les définitions du glossaire métier. 

En tant utilisateur intermédiaire, vous pouvez affiner le graphique en reliant les termes du glossaire aux jeux de données, en marquant les relations entre les domaines et en établissant des relations sémantiques. Vous pouvez utiliser le graphique pour analyser l'impact. Si vous modifiez un jeu de données supprimez une colonne, la plateforme identifiera toutes les dépendances en aval via le parcours du graphique. 

Intégration de l'IA et cas d'utilisation de l'IA agentique

La plateforme propose un serveur MCP, qui permet de fournir des données régulées et de haute qualité aux assistants IA basés sur des LLM.  

Cela signifie que les utilisateurs professionnels ou les analystes peuvent poser une question en langage naturel à un assistant IA, par exemple : « Quel était notre chiffre d'affaires net en Europe au dernier trimestre ? ». L'assistant utilise le graphe de connaissances, le serveur MCP, métadonnées et data contracts générer des réponses ou des instructions SQL conformes aux gouvernance . 

Les utilisateurs intermédiaires doivent surveiller les performances et la précision de ces interactions IA, mesurer utilisateur et garantir des boucles de rétroaction afin d'améliorer métadonnées . 

Observabilité des données

L'une des évolutions importantes de la plateforme est l'introduction de Actian Data observabilité. Cette solution s'intègre à la plateforme de data intelligence pour assurer une surveillance en temps réel de la qualité des données et des anomalies. 

En tant utilisateur intermédiaire, vous pouvez définir des indicateurs de qualité clés pour data products critiques, les connecter à observabilité et définir des alertes et des workflows pour les cas où les seuils de qualité sont dépassés. Utilisez cette fonctionnalité pour appliquer gouvernance la conception. Grâce à cette approche, data products marketplace des données marketplace des seuils de qualité et des mécanismes de correction. 

Reliez les observations sur la qualité des liens aux métadonnées. S'il y a une anomalie un jeu de données, veillez à ce qu'elle soit consignée dans les métadonnées dans la gestion des cas afin que les utilisateurs comprennent les problèmes passés. 

Meilleures pratiques pour les utilisateurs intermédiaires

Ces bonnes pratiques concrètes garantissent que l'adoption de la plateforme vous apporte une valeur durable à long terme : 

  • Commencez par les domaines et jeux de données à forte valeur ajoutée. Évitez d'essayer de tout cataloguer d'un seul coup. Commencez par des domaines ciblés et élargissez ensuite.
  • Comprenez que métadonnées ne métadonnées pas quelque chose que l'on « configure une fois pour toutes ». Prévoyez des révisions périodiques des propriétaires, gestionnaires, des définitions et jeu de données , et retirez les actifs obsolètes.
  • Embarquer gouvernance le résultat, et non comme un processus distinct. Publier data products les contrats, les politiques et les contrôles d'accès, et automatiser l'application lorsque cela est possible.
  • Traitez les utilisateurs professionnels comme des citoyens de première classe. Assurez-vous que utilisateur est utilisable, que le glossaire métier est complet, que la recherche est intuitive et que les utilisateurs professionnels disposent de l'accès dont ils ont besoin.
  • Surveiller l'utilisation et les indicateurs. Suivez les produits les plus utilisés et les moins utilisés, utilisateur et l'efficacité des recherches. Utilisez ces informations pour orienter métadonnées et retirer les ressources inutilisées.
  • entraîner communiquer.métadonnées concerne autant les personnes que la technologie. Offrez apprentissage, faites du marketing interne, organisez des heures de bureau pour les gestionnaires de données et mettez en place des boucles de rétroaction.
  • Assurer évolutivité. Au fur et à mesure que vous ajoutez des domaines, des sources et des utilisateurs, assurez-vous que votre architecture peut évoluer sans goulots d’étranglement au niveau des performances.
  • Planifier le changement. Lorsque les sources de données ou les modèles commerciaux sous-jacents changent, vous aurez besoin de notifications et de workflows pour mettre à jour métadonnées la lignée, ainsi que pour communiquer avec les consommateurs de données.
  • Documenter les flux de travail et les responsabilités. Définir qui est responsable de quoi, par exemple le propriétaire du domaine, l'intendant, métadonnées et le propriétaire du connecteur technique. Clarifier les les rôles et les responsabilités afin que rien ne soit perdu ou négligé.
  • Mettre en place des mesures de sécurité, de conformité et d'identification des informations sensibles. Veiller à ce que data products les informations personnelles identifiables et autres données sensibles, appliquent le contrôle d'accès et conservent des pistes d'audit. La plateforme prend en charge cette fonctionnalité. 

Mettre en œuvre la plateforme Actian Data Intelligence

Actian Data Intelligence Platform est une puissante marketplace d'entreprise métadonnées, le catalogue, gouvernance et marketplace , basée sur un graphe de connaissances et conçue pour répondre aux besoins des utilisateurs techniques et commerciaux. En tant utilisateur intermédiaire, vous devez vous concentrer non seulement sur la mise en place et le fonctionnement de la plateforme, mais aussi sur son intégration dans les processus de votre organisation.

Ces processus comprennent la définition des domaines et data products, l'enrichissement métadonnées et l'activation de la libre-service . La plateforme offre également gouvernance , Fonctionnalités avancées Fonctionnalités la traçabilité et observabilité des données, ainsi que des données prêtes pour l'IA. Vous pouvez utiliser la plateforme pour démocratiser l'accès aux données, établir la confiance et activer l'IA.

Prêt à commencer ? Demandez une démonstration en direct dès aujourd'hui pour découvrir comment la plateforme Actian Data Intelligence transforme les flux de travail et simplifie gestion des données.

FAQ

Une marketplace données d'entreprise est une plateforme gouvernée qui connecte les producteurs et les consommateurs de données, permettant la publication, la découverte, l'octroi de licences et la livraison sécurisée de data products curatées, avec des API et des connecteurs pour intégrer les données dans les flux de travail d'analyse et d'IA.

Examinez le score de qualité du fournisseur, demandez des exemples de jeux de données et vérifiez la documentation des schémas. De nombreuses plateformes proposent des essais pour évaluer la qualité.

Priorité à la gouvernance et à l'application automatisée des politiques, à la qualité des données et à la vérification de leur provenance, à la recherche intuitive, à la flexibilité des licences et de la facturation, à l'intégration transparente de l'analyse et de l'intelligence artificielle, ainsi qu'à l'évolutivité et à l'automatisation de la conformité aux réglementations.

Les défis communs comprennent l'équilibre entre la protection de la vie privée et l'accès, l'intégration des systèmes existants, la mise à l'échelle de l'infrastructure, l'adoption et la gestion de la complexité des licences ; ces défis sont relevés par la gestion du changement, l'apprentissage et les projets pilotes en plusieurs phases.

Les marchés publics ont des listes ouvertes à tout acheteur qualifié, tandis que les bourses privées limitent l'accès aux participants invités et proposent souvent des accords personnalisés.

Data contracts Embarquer définitions de schémas et des seuils de qualité que les pipelines CI/CD valident à chaque version, garantissant ainsi la conformité.

Connectez l'API de la marketplaceà votre pipeline, intégrez les définitions de schémas dans le contrôle de version et configurez des tests automatisés pour la qualité des données.

Vérifier le contrat de données du fournisseur pour ce qui est de la documentation du consentement et de l'enregistrement de l'audit. Examiner les certifications de conformité et les accords de traitement des données.

Ils combinent le contrôle des fournisseurs, le profilage automatisé et la détection des anomalie , le suivi de la lignée, les accords de niveau de service et le contrôle continu de la conformité avec des pistes d'audit détaillées et l'intégration aux systèmes de sécurité et de gouvernance .