Comment l'intelligence artificielle améliore les catalogues de données
Actian Corporation
5 juin 2019

Les machines peuvent-elles penser ? Nous parlons de l'intelligence artificielle, "le plus grand mythe de notre époque".
Une définition simple de l'IA pourrait être la suivante : "un ensemble de théories et de techniques appliquées pour créer des machines capables de simuler l'intelligence". Parmi ces fonctions de l'IA, il y a le deep learning, une méthode d'apprentissage automatisée utilisée pour traiter les données.
Les données doivent être comprises et accessibles. C'est à l'aide d'un catalogue de données intelligent que les utilisateurs de données, tels que les data scientists, peuvent facilement rechercher et choisir efficacement les bons ensembles de données pour leurs algorithmes d'apprentissage automatique.
Voyons comment.
Moteur de recherche : Facilitation jeu de données Research
En se connectant à toutes les sources de données d'une entreprise, un catalogue de données peut extraire efficacement un maximum de documentation (également appelée métadonnées) de ses systèmes de stockage.
Ces informations, indexées et filtrées dans le moteur de recherche de Zeenea, permettent aux utilisateurs de données d'atteindre rapidement les ensembles de données nécessaires à leurs systèmes d'information.
Système de recommandation
Guider les Data Scientists dans leurs choix
Un catalogue de données catalogue de données est un outil qui repose sur la technologie des "empreintes digitales". Cette fonction intelligente fournit des recommandations aux utilisateurs de données quant aux ensembles de données les plus pertinents pour leurs projets, sur la base, entre autres, des critères suivants :
- Comment les données sont-elles utilisées ?
- La qualité et la notation de la documentation.
- Ses recherches précédentes.
- Ce que les autres utilisateurs recherchent.
- Donner plus de sens à leurs ensembles de données.
Cette fonction offre aux utilisateurs de données responsables d'un ensemble de données particulier des suggestions quant à sa documentation. Ces recommandations peuvent, par exemple, être associées à des étiquettes, des contacts ou même des termes commerciaux d'autres ensembles de données :
- L'analyse des données elles-mêmes (analyse statistique).
- Le schéma ressemble à d'autres ensembles de données.
- Les liens sur les champs de l'autre ensemble de données.
- La contextualisation automatique des ensembles de données dans un catalogue de données permet à tout utilisateur données de travailler avec des données qui sont comprises et adaptées à leurs cas d'utilisation.
jeu de données automatique jeu de données Linking : Visualiser le cycle de vie de vos données
Comme indiqué plus haut, grâce à la technologie des empreintes digitales, un catalogue de données peut reconnaître d'autres ensembles de données et s'y connecter. Nous parlons ici de lignage des données : une représentation visuelle des cycles de vie des données.
Détection automatique des erreurs : Soyez conscient des erreurs dans les ensembles de données
Afin de surmonter les problèmes potentiels d'interprétation des données, un catalogue de données intelligent doit être capable de détecter automatiquement les erreurs ou les malentendus dans la qualité et la documentation des données.
Cette caractéristique clé, basée sur l'analyse des données ou leur documentation, doit alerter les utilisateurs des données sur leur intégrité.
Notification GDPR : Notifier les informations sensibles
Un catalogue de données intelligent doit être capable de détecter les données personnelles/privées dans tout ensemble de données donné et de les signaler sur son interface. Cette fonctionnalité aide les entreprises à répondre aux différentes exigences du GDPR mises en place en mai 2018, mais aussi à alerter les utilisateurs potentiels sur le niveau de sensibilité ainsi que sur l'utilisation de leurs données.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.