Qu’est-ce qu’un Smart Data Catalog ?
L'idée d'un catalogue de données intelligent est apparue il y a quelques années dans la littérature relative à la gestion des métadonnées , bien qu'elle n'ait pas de définition officielle. Le consensus général est qu'un catalogue de données doit disposer de l'apprentissage automatique et de l'IA pour libérer son potentiel.
- Métamodélisation
- Inventaire des données
- Gestion des métadonnées
- Moteur de recherche
- expérience utilisateur
Obtenez votre livre électronique
(c'est-à-dire sales@..., support...).
Aperçu
Quelle que soit sa taille, un système d'information contient plusieurs dizaines de systèmes et d'applications qui stockent des données à travers une grande variété de sources (bases de données relationnelles et non relationnelles, systèmes de fichiers distribués, API, solutions cloud, etc. Chaque système gère des centaines ou des milliers de jeux de données - généralement des tables ou des fichiers - eux-mêmes composés de dizaines de champs (ou colonnes). Et chaque jeu de données et chaque champ alimente un métamodèle (en d'autres termes, un ensemble de métadonnées structurées) qui permet l'exploration des données.
En fin de compte, un catalogue de données devra exploiter d'énormes quantités d'informations très diverses - et son volume augmentera de manière exponentielle, tout comme le volume de données utilisables. Ce volume d'informations soulèvera deux problèmes majeurs :
- Comment alimenter et maintenir le volume d'informations sans tripler (ou plus) le coût de la gestion des métadonnées .
- Comment trouver les jeux de données les plus pertinents pour un cas d'usage spécifique.
Pour nous, un catalogue de données intelligent devrait avoir une portée beaucoup plus large que l'intégration d'algorithmes d'IA et devrait inclure une gamme de caractéristiques technologiques et conceptuelles intelligentes qui fournissent des réponses aux deux questions ci-dessus.