Intelligence des données

Qu'est-ce qui rend un catalogue de données "intelligent" ? #5 - expérience de l'utilisateur

Actian Corporation

16 février 2022

utilisateur

A catalogue de données exploite d'énormes quantités d'informations très diverses, et son volume va croître de manière exponentielle. Cela soulèvera deux défis majeurs :

  • Comment alimenter et maintenir le volume d'informations sans tripler (ou plus) le coût de la gestion desmétadonnées ?
  • Comment trouver les ensembles de données les plus pertinents pour un cas d'usage spécifique ?

A catalogue de données devrait être intelligent pour répondre à ces 2 questions, avec des caractéristiques technologiques et conceptuelles intelligentes qui vont au-delà de la seule intégration d'algorithmes d'IA.

À cet égard, nous avons identifié 5 domaines dans lesquels un catalogue de données peut être "intelligent" - la plupart d'entre eux ne faisant pas appel à l'apprentissage automatique:

  1. Métamodélisation
  2. L'inventaire des données
  3. Gestion des métadonnées
  4. Le moteur de recherche
  5. expérience utilisateur

Un catalogue de données doit également être intelligent dans l'expérience qu'il offre à ses différents groupes d'utilisateurs. En effet, l'un des principaux défis liés au déploiement 'un catalogue de données est son niveau d'adoption par ceux à qui il est destiné : les consommateurs de données. Et l'expérience de l'utilisateur joue un rôle majeur dans cette adoption.

utilisateur Experience Within the catalogue de données

L'objectif sous-jacent de l'expérience utilisateur est l'identification de personas dont on cherche à modéliser le comportement et les objectifs afin de leur fournir une interface graphique fluide et efficace. L'identification des personas dans un catalogue de données est un défi, c'est un outil universel qui apporte une valeur ajoutée à toute entreprise quelle que soit sa taille, dans tous les secteurs d'activité et partout dans le monde.

Plutôt que de tenter de modéliser des personas difficiles à définir, il est possible de gérer la situation en se concentrant sur la question de l'adoption du catalogage de données. Ici, deux populations d'utilisateur se distinguent :

  • métadonnées les producteurs qui alimentent le catalogue et contrôlent la qualité de son contenu - cette population est généralement appelée Data Stewards.
  • métadonnées les consommateurs qui utilisent le catalogue pour répondre à leurs besoins professionnels - nous les appellerons les utilisateurs.

Bien entendu, ces deux groupes ne sont pas totalement étrangers l'un à l'autre : certains gestionnaires de données sont également des utilisateurs.

Les défis de l'adoption d'un catalogue à l'échelle de l'entreprise

La véritable valeur d'un catalogue de données réside dans son adoption à grande échelle par un grand nombre de consommateurs de (méta) données, et pas seulement par les spécialistes de la gestion des données .

Les consommateurs de données sont très diversifiés. Il comprend des experts en données (ingénieurs, architectes, analystes de données, data scientists, etc.), des professionnels (chefs de projet, responsables d'unité opérationnelle, chefs de produit, etc.), des responsables de la conformité et des risques. Plus généralement, tous les responsables opérationnels sont susceptibles d'exploiter les données pour améliorer leurs performances.

L'adoption du catalogue de données par les utilisateurs est souvent ralentie pour les raisons suivantes :

  • L'utilisation du catalogue de données est sporadique. Ils se connectent de temps en temps pour obtenir des réponses très précises à des questions spécifiques. Ils ont rarement le temps ou la patience d'apprendre à utiliser un outil qu'ils n'utiliseront que périodiquement - des semaines peuvent s'écouler entre deux utilisations du catalogue.
  • Tout le monde n'a pas la même position sur les métadonnées. Certains se concentreront davantage sur les métadonnées techniques, d'autres sur les défis sémantiques, et d'autres encore sur les aspects organisationnels et de gouvernance .
  • Tout le monde ne comprendra pas le métamodèle ou l'organisation interne de l'information dans le catalogue. Ils peuvent rapidement se sentir découragés par une avalanche de concepts qui ne correspondent pas à leurs besoins quotidiens.

Le Smart catalogue de données tente de surmonter ces obstacles afin d'accélérer l'adoption du catalogue. Voici comment la plateforme Actian Data Intelligence Platform relève ces défis.

Comment la plateforme Actian Data Intelligence facilite l'adoption du catalogue

La première solution est l'interface graphique. La courbe d'apprentissage des utilisateurs doit être aussi courte que possible. En effet, l'utilisateur doit être opérationnel sans avoir besoin d'apprentissage quoi que ce soit. Pour rendre cela possible, nous avons fait un certain nombre de choix.

Le premier choix a été de fournir deux interfaces différentes, l'une pour les gestionnaires de données et l'autre pour les utilisateurs :

Studio: L'outil de gestion et de suivi du contenu du catalogue - un outil expert réservé aux Data Stewards.

Explorer: Pour les utilisateurs, il s'agit d'une expérience de recherche et d'exploration la plus simple possible.

Notre approche est alignée sur les principes de utilisateur des solutions de place de marché - les spécialistes reconnus de la gestion de catalogues (au sens général). Ces solutions proposent généralement deux applications. La première, une solution de "back office", qui permet au personnel de la place de marché (ou à ses partenaires) d'alimenter le catalogue de la manière la plus automatisée possible et d'en contrôler le contenu pour en assurer la qualité. La seconde application, destinée aux consommateurs, prend généralement la forme d'un site web de commerce électronique et permet aux utilisateurs finaux de trouver des articles ou d'explorer le catalogue. Studio et Explorer reflètent ces deux rôles.

L'information est classée en fonction du rôle de l'utilisateur au sein de l'organisation

Notre deuxième choix est encore au stade expérimental et consiste à adapter dynamiquement la hiérarchie de l'information dans le catalogue en fonction des profils des utilisateur .

Ce défi de la hiérarchie de l'information est ce qui différencie un catalogue de catalogue de données un catalogue de type place de marché. En effet, la hiérarchie des informations d'un catalogue de donnéesdépend du rôle opérationnel de l'utilisateur. Pour certains, les informations les plus pertinentes dans un jeu de données seront d'ordre technique : localisation, sécurité, formats, types, etc. D'autres auront besoin de connaître la sémantique des données et leur origine. D'autres encore voudront connaître les processus et les contrôles qui régissent la production des données - pour des raisons de conformité ou des considérations opérationnelles.

Le catalogue de données intelligent doit pouvoir ajuster dynamiquement la structure de l'information pour s'adapter à ses différents prismes. 

Le dernier défi qui reste à relever est la manière dont l'information est organisée dans le catalogue sous la forme de parcours d'exploration par thème (un peu comme les rayonnages d'une place de marché). Il est difficile de trouver une structure qui convienne à tout le monde. Certains exploreront le catalogue d'un point de vue technique (systèmes, applications, technologies, etc.). D'autres exploreront le catalogue d'un point de vue plus fonctionnel (domaines d'activité), d'autres encore d'un point de vue sémantique (à travers des glossaires d'activité, etc.).

Le défi de mettre tout le monde d'accord sur une seule classification universelle nous semble (à nous) insurmontable. Le catalogue de données Smart doit être adaptable et ne doit pas demander aux utilisateurs de comprendre une classification qui n'a pas de sens pour eux. En fin de compte, l'expérience de l'utilisateur est l'un des facteurs de succès les plus importants pour un catalogue de données.

Pour plus d'informations sur la manière dont un Smart améliore un catalogue de données, téléchargez notre eBook : "Qu'est-ce qu'un catalogue de données intelligent ?

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous couvrons des sujets allant de l'ingestion de données en temps réel à l'analyse pilotée par l'IA.