Démocratisation des données pour des utilisateurs de niveaux de compétences et de chartes variés
Si vous êtes ingénieur de données ou architecte de données, vous passez sans doute vos nuits à vous demander comment concevoir vosplateformes support intégration, support gestion et support , afin que vos collègues administrateurs de bases de données et responsables des opérations informatiques puissent les gérer facilement, tout en permettant à un large éventail d’utilisateurs de données de les exploiter simultanément. Ces utilisateurs vont des nouveaux utilisateurs exigeants et actifs, tels que les développeurs et data scientists, à ceux qui utilisent traditionnellement les données via SQL et des requêtes ad hoc, comme les analystes métier, en passant par ceux qui interagissent indirectement avec les données via des applications métier.
Tout le monde dans votre entreprise n'est pas data scientist et, vu leur rareté, votre entreprise serait bien petite si ceux-ci constituaient la majorité du personnel. Au risque de trop généraliser le rôle des data scientists, ceux-ci ont généralement besoin de données permettant de concevoir et apprentissage pouvant être déployés en aval, Embarqué d'autres applications et utilisés par d'autres utilisateurs. Data scientists ont Data scientists besoin d'ensembles de données volumineux et variés, mais ceux-ci doivent rarement être en temps réel ; toutefois, la fraîcheur des données est une exigence primordiale, car ils itèrent apprentissage heuristique apprentissage leurs modèles.
Les développeurs d'applications, tout comme data scientists à interagir avec leurs données via des API de programmation. Les ensembles de données sur lesquels ils travaillent sont généralement plus petits, ou bien il s'agit de séries chronologiques et de données en temps réel, Embarqué au processus métier plutôt que de simplement l'alimenter, comme c'est souvent le cas pour les data scientists. Pour les analystes métier, les besoins sont encore différents, et pour les utilisateurs finaux, l'objectif est de rendre les données invisibles dans leurs opérations – même si celles-ci sont indissociables et essentielles à ces opérations. Le point essentiel ici est que les concepteurs de systèmes de données doivent être capables de rendre les données accessibles, mais à plusieurs groupes distincts qui ne possèdent pas les mêmes compétences, rôles, responsabilités ou niveaux d'intérêt en matière de données.
Quelles sont les responsabilités qui en découlent pour les ingénieurs de données ou les architectes de données ? C'est simple : rendre les données exploitables afin que des personnes aux niveaux de compétence variés puissent y accéder selon leurs besoins, au moment où elles en ont besoin et de la manière la plus utile possible. Bon, d'accord, ce n'est peut-être pas si simple. Comment éviter en silo données, gérés par des systèmes sur mesure, si l'on se contente de répondre de manière trop restrictive aux besoins de chacun de ces groupes cibles ?
Comprenez votre utilisateur et la manière dont elle utilise les données
Au sein de votre entreprise, chaque collaborateur a des besoins spécifiques en matière de données, tant en ce qui concerne le type de données et les outils dont il a besoin que la manière dont cette utilisation des données est jugée efficace. Certains de vos utilisateurs peuvent avoir besoin d'accéder à un jeu de données très spécifique jeu de données effectuer une tâche ciblée, tâche d'autres peuvent avoir besoin de données globales pour la planification et prise de décision stratégique, par exemple. Certains de vos utilisateurs auront besoin de données brutes détaillées, tandis que d'autres auront besoin de tableaux de bord, de rapports et de visualisations préparés. Dans de nombreux cas, le même utilisateur peut s’inscrire dans chacun des scénarios ci-dessus, mais à des phases différentes d’un projet. Dans d’autres cas, ces différents scénarios exploitent les mêmes données sous différentes formes ou manipulées de différentes manières, et en combinaison avec d’autres ensembles de données.
Pour aider vos utilisateurs de données à réussir, il faut bien cerner le niveau de compétence des utilisateurs ainsi que les outils et jeux de données auront besoin. Par exemple, outre les ensembles de données mentionnés plus haut, data scientists à consacrer beaucoup de temps à la préparation des données et à la programmation manuelle d’algorithmes, ou à l’utilisation de bibliothèques pour l’IA et le ML, telles que TensorFlow. À l’inverse, les analystes métier ont davantage tendance à utiliser SQL pour le reporting et les outils courants de BI et de visualisation sur ces jeux de données interrogés. Les utilisateurs avancés du côté métier peuvent être capables de traiter des requêtes plus simples, mais sont plus à l'aise avec la manipulation de feuilles de calcul, comme c'est le cas de votre personnel chargé des finances et de la planification. Chacun de ces utilisateurs a un ensemble unique de besoins, non seulement en matière de données, mais aussi en matière d'outils qui définissent concrètement la manière dont ils exploitent les données pour faire leur travail. Vous pouvez en savoir plus sur la gamme de gestion des données Actian ici.