Intelligence des données

Comment l'intelligence artificielle améliore les catalogues de données

Actian Corporation

5 juin 2019

L'IA améliore les catalogues de données

Les machines peuvent-elles penser ? Nous parlons de l'intelligence artificielle, "le plus grand mythe de notre époque".

Une définition simple de l'IA pourrait être la suivante : "un ensemble de théories et de techniques appliquées pour créer des machines capables de simuler l'intelligence". Parmi ces fonctions de l'IA, il y a le deep learning, une méthode d'apprentissage automatisée utilisée pour traiter les données.

Les données doivent être comprises et accessibles. C'est à l'aide d'un catalogue de données intelligent que les utilisateurs de données, tels que les data scientists, peuvent facilement rechercher et choisir efficacement les bons ensembles de données pour leurs algorithmes d'apprentissage automatique.

Voyons comment.

Moteur de recherche : Facilitation jeu de données Research

En se connectant à toutes les sources de données d'une entreprise, un catalogue de données peut extraire efficacement un maximum de documentation (également appelée métadonnées) de ses systèmes de stockage.

Ces informations, indexées et filtrées dans le moteur de recherche de Zeenea, permettent aux utilisateurs de données d'atteindre rapidement les ensembles de données nécessaires à leurs systèmes d'information.

Système de recommandation

Guider les Data Scientists dans leurs choix

Un catalogue de données catalogue de données est un outil qui repose sur la technologie des "empreintes digitales". Cette fonction intelligente fournit des recommandations aux utilisateurs de données quant aux ensembles de données les plus pertinents pour leurs projets, sur la base, entre autres, des critères suivants :

  • Comment les données sont-elles utilisées ?
  • La qualité et la notation de la documentation.
  • Ses recherches précédentes.
  • Ce que les autres utilisateurs recherchent.
  • Donner plus de sens à leurs ensembles de données.

Cette fonction offre aux utilisateurs de données responsables d'un ensemble de données particulier des suggestions quant à sa documentation. Ces recommandations peuvent, par exemple, être associées à des étiquettes, des contacts ou même des termes commerciaux d'autres ensembles de données :

  • L'analyse des données elles-mêmes (analyse statistique).
  • Le schéma ressemble à d'autres ensembles de données.
  • Les liens sur les champs de l'autre ensemble de données.
  • La contextualisation automatique des ensembles de données dans un catalogue de données permet à tout utilisateur données de travailler avec des données qui sont comprises et adaptées à leurs cas d'utilisation.

jeu de données automatique jeu de données Linking : Visualiser le cycle de vie de vos données

Comme indiqué plus haut, grâce à la technologie des empreintes digitales, un catalogue de données peut reconnaître d'autres ensembles de données et s'y connecter. Nous parlons ici de lignage des données : une représentation visuelle des cycles de vie des données.

Détection automatique des erreurs : Soyez conscient des erreurs dans les ensembles de données

Afin de surmonter les problèmes potentiels d'interprétation des données, un catalogue de données intelligent doit être capable de détecter automatiquement les erreurs ou les malentendus dans la qualité et la documentation des données.

Cette caractéristique clé, basée sur l'analyse des données ou leur documentation, doit alerter les utilisateurs des données sur leur intégrité.

Notification GDPR : Notifier les informations sensibles

Un catalogue de données intelligent doit être capable de détecter les données personnelles/privées dans tout ensemble de données donné et de les signaler sur son interface. Cette fonctionnalité aide les entreprises à répondre aux différentes exigences du GDPR mises en place en mai 2018, mais aussi à alerter les utilisateurs potentiels sur le niveau de sensibilité ainsi que sur l'utilisation de leurs données.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.