Qu’est-ce qu’un Smart Data Catalog ?
L'idée d'un catalogue de données intelligent catalogue de données depuis quelques années dans la littérature métadonnées , bien qu'il n'existe aucune définition officielle. Le consensus général est qu'un catalogue de données doit intégrer l'apprentissage automatique et l'IA pour libérer son potentiel.
- Métamodélisation
- Inventaire des données
- Gestion des métadonnées
- Moteur de recherche
- expérience utilisateur
Obtenez votre livre électronique
(par exemple, sales@..., support)
Aperçu
Quelle que soit sa taille, un système d'information contient plusieurs dizaines de systèmes et d'applications qui stockent des données provenant d'une grande variété de sources (bases de données relationnelles et non relationnelles, systèmes de fichiers distribués, API, solutions cloud, etc.), selon des protocoles, des formats et des règles spécifiques. Chaque système gère des centaines, voire des milliers de jeux de données généralement des tables ou des fichiers – eux-mêmes composés de dizaines de champs (ou colonnes). Et chaque jeu de données chaque champ alimente un métamodèle (autrement dit, un ensemble de métadonnées structurées) qui rend possible l'exploration des données.
Au final, un catalogue de données exploiter d'énormes quantités d'informations très diverses, dont le volume augmentera de manière exponentielle, tout comme celui des données exploitables. Ce volume d'informations soulèvera deux problèmes majeurs :
- Comment alimenter et maintenir le volume d'informations sans tripler (ou plus) le coût de métadonnées .
- Comment trouver les jeux de données les plus pertinents jeux de données un cas d'usage spécifique.
Pour nous, un catalogue de données intelligent catalogue de données avoir une portée beaucoup plus large que l'intégration d'algorithmes d'IA et devrait inclure une gamme de fonctionnalités technologiques et conceptuelles intelligentes qui apportent des réponses aux deux questions ci-dessus.