Démocratisation des données pour des utilisateurs de niveaux de compétences et de chartes variés
Actian Corporation
11 juin 2019

Si vous êtes un ingénieur ou un architecte de données, vous vous demandez probablement comment concevoir vosplateformesintégration, de gestion et d'analyse des données, de sorte que vos administrateurs de bases de données et vos collègues des opérations informatiques puissent les gérer facilement et qu'un ensemble varié d'utilisateurs de données puissent les utiliser simultanément. Ces utilisateurs vont des nouveaux utilisateurs exigeants et pratiques, tels que les développeurs et les scientifiques des données, à ceux qui utilisent traditionnellement les données par le biais de requêtes SQL et ad hoc, tels que les analystes commerciaux, ainsi qu'à ceux qui interagissent avec les données indirectement par le biais d'applications commerciales.
Tous les membres de votre entreprise ne sont pas des scientifiques des données et, compte tenu de leur rareté, vous seriez dans une bien petite entreprise s'ils constituaient la majorité du personnel. Au risque de généraliser à l'excès le rôle des scientifiques des données, ceux-ci ont généralement besoin de données pour concevoir et apprentissage algorithmes qui peuvent être déployés en aval, Embarqué dans d'autres applications et utilisés par d'autres utilisateurs. Les scientifiques des données ont souvent besoin d'ensembles de données vastes et variés, mais il est rare qu'ils aient besoin de données en temps réel, bien que la fraîcheur soit une exigence primordiale lorsqu'ils itèrent l'apprentissage heuristique de leurs modèles.
Les développeurs d'applications, comme les scientifiques des données, ont tendance à interagir avec leurs données par le biais d'API de programmation. Les ensembles de données sur lesquels ils travaillent ont tendance à être plus petits, ou à être des séries temporelles et en temps réel, Embarqué directement dans le processus commercial au lieu de l'informer comme c'est souvent le cas avec ce que fait un scientifique des données. Pour les analystes commerciaux, les besoins sont encore différents et pour les utilisateurs finaux, il s'agit de rendre les données invisibles pour leurs opérations - même si elles en font partie intégrante et sont essentielles à ces opérations. L'idée est donc que les concepteurs de systèmes de données doivent être en mesure de rendre les données disponibles, mais à plusieurs factions différentes qui n'ont pas les mêmes compétences, rôles et responsabilités ou niveaux d'intérêt lorsqu'il s'agit de données.
Quel mandat cela confère-t-il aux ingénieurs ou architectes de données ? C'est simple. Rendre les données utilisables par des personnes de différents niveaux de compétences afin qu'elles puissent consommer ce dont elles ont besoin, quand elles en ont besoin et de la manière la plus utile. D'accord, ce n'est peut-être pas si simple. Comment éviter les ensembles de données en silo , gérés par des systèmes sur mesure, si l'on s'adresse étroitement à chacun de ces groupes ?
Comprendre votre communauté d'utilisateur et la façon dont elle utilise les données
Au sein de votre entreprise, chacun a ses propres besoins en matière de données, tant en ce qui concerne le type de données et d'outils qu'il doit utiliser que la manière dont cette utilisation des données est jugée efficace. Certains utilisateurs peuvent avoir besoin d'accéder à un jeu de données très spécifique pour effectuer une tâche professionnelle précise, tandis que d'autres ont besoin de données globales pour la planification et la prise de décision stratégique, par exemple. Certains de vos utilisateurs auront besoin de données brutes détaillées, tandis que d'autres auront besoin de tableaux de bord, de rapports et de visualisations. Dans de nombreux cas, le même utilisateur peut correspondre à chacun des scénarios ci-dessus, mais au cours de différentes phases d'un projet. Dans d'autres cas, ces différents scénarios exploitent les mêmes données sous différentes formes ou manipulées de différentes manières et en combinaison avec d'autres ensembles de données.
Pour que les utilisateurs de données réussissent, il faut comprendre les niveaux de compétence des consommateurs ainsi que les outils et les ensembles de données dont ils auront besoin. Par exemple, outre les ensembles de données mentionnés ci-dessus, les data scientists ont tendance à passer beaucoup de temps à préparer les données et à coder manuellement des algorithmes ou à utiliser des bibliothèques pour l'IA et la ML, telles que TensorFlow. À l'inverse, les analystes commerciaux sont plus enclins à utiliser SQL pour la création de rapports et les outils de BI et de visualisation les plus courants sur les ensembles de données interrogés. Les utilisateurs expérimentés du côté de l'entreprise peuvent être en mesure de traiter des requêtes plus simples, mais sont plus à l'aise dans la manipulation de feuilles de calcul, comme le personnel des finances et de la planification. Chacun de ces utilisateurs a un ensemble unique de besoins, non seulement pour les données, mais aussi pour les outils qui définissent réellement la manière dont ils exploitent les données pour faire leur travail. Pour en savoir plus sur la gamme de solutions de gestion des données d'Actian , cliquez ici.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.