Blog | Intelligence des données | | 11 min de lecture

Un système efficace de gestion des autorisations pour un catalogue de données

permission-management-sets-zeenea-data-catalog

Résumé

  • Les catalogues de données associent métadonnées techniques automatisées métadonnées métadonnées métier gérées manuellement, ce qui nécessite un contrôle rigoureux pour garantir leur fiabilité.
  • Un système de gestion des autorisations est indispensable pour contrôler qui peut accéder au contenu du catalogue, le modifier ou le gérer.
  • Parmi les principales exigences figurent des autorisations flexibles et détaillées, une visibilité claire des droits d'accès et une administration simplifiée.
  • Il existe trois approches principales : l'approche ouverte (crowdsourcing), les autorisations utilisateur et les autorisations basées sur les ressources.
  • Les autorisations basées sur les ressources offrent le meilleur compromis en garantissant un contrôle précis, une transparence optimale et évolutivité le volume de données augmente.

Le catalogue de données enrichit l’ensemble des ressources de données disponibles en s’appuyant sur deux types d’informations : d’une part, des informations purement techniques qui sont automatiquement synchronisées à partir de leurs sources ; et d’autre part, des informations métier issues du travail des gestionnaires de données. Ces dernières sont mises à jour manuellement et comportent donc des risques pour l’ensemble de l’organisation.

Un système de gestion des permissions est donc essentiel pour définir et contrôler les droits d'accès des utilisateurs du catalogue. Dans cet article, nous détaillons les caractéristiques fondamentales et les approches possibles pour construire un système de gestion des permissions efficace, ainsi que la solution mise en place par Actian Data Intelligence Platform. catalogue de données.

Système de gestion des permissions : Un outil essentiel pour l'ensemble de l'organisation

Pour catalogue de données aient confiance dans les informations qu'ils consultent, il est essentiel que la documentation des objets catalogués soit pertinente, de qualité et, surtout, fiable. Vos utilisateurs doivent pouvoir trouver, comprendre et utiliser facilement les données mises à leur disposition.

L'origine de l'information et de l'automatisation des catalogues

Un catalogue de données intègre généralement deux types d'informations. D'une part, des informations purement techniques qui proviennent directement de la source de données. Ces informations sont synchronisées de manière totalement automatisée et continue entre le catalogue de données et chaque source de données afin de garantir leur véracité et leur fraîcheur. D'autre part, le catalogue contient toute la documentation métier ou organisationnelle, qui provient du travail des Data Stewards. Ces informations ne sont pas automatisables, elles sont mises à jour manuellement par les équipes de gestion des données de l'entreprise.

Un système de gestion des autorisations est une condition préalable à l'utilisation d'un catalogue de données

Pour gérer cette deuxième catégorie d'informations, le catalogue doit comporter des mécanismes de contrôle d'accès et de saisie. En effet, il n'est pas souhaitable que n'importe quel utilisateur du catalogue de données de votre organisation puisse créer, modifier, importer, exporter ou même supprimer des informations sans en avoir reçu l'autorisation préalable. Un système de gestion des permissions utilisateur est donc indispensable ; il joue le rôle d'un gardien des droits d'accès des utilisateurs.

Les 3 caractéristiques fondamentales du système de gestion des autorisations d'un catalogue de données

La mise en œuvre d'un système de gestion des autorisations à l'échelle de l'entreprise est soumise à un certain nombre d'attentes qui doivent être prises en compte lors de sa conception. Parmi celles-ci, nous avons choisi dans cet article de nous concentrer sur trois caractéristiques fondamentales d'un système de gestion des autorisations : son niveau de granularité et de flexibilitéson niveau de granularité et de flexibilité, sa lisibilité et son auditabilité, et sa facilité d'administration.

Granularité et flexibilité

Tout d'abord, un système de gestion des autorisations doit avoir le bon niveau de granularité et de flexibilité. Certaines actions doivent être accessibles à l'ensemble du catalogue pour en faciliter l'utilisation. D'autres actions doivent être limitées à certaines parties du catalogue. Certains utilisateurs auront des droits globaux sur tous les objets du catalogue, tandis que d'autres seront limités à l'édition du périmètre qui leur a été attribué. Le système de gestion des permissions doit donc permettre cet éventail de possibilités, de la permission globale à la finesse d'un objet dans le catalogue.

Nos clients sont de toutes tailles, avec des niveaux de maturité très hétérogènes en matière de gouvernance données. Certains sont des start-ups, d'autres de grandes entreprises. Certains ont une culture de la donnée déjà bien intégrée dans leurs processus, tandis que d'autres n'en sont qu'au début de leur processus d'acculturation à la donnée. Le système de gestion des autorisations doit donc être suffisamment flexible pour s'adapter à tous les types d'organisations.

Lisibilité et auditabilité

Deuxièmement, un système de gestion des autorisations doit être claire et facile à comprendre. Lors d’un audit ou d’un examen des autorisations du système, un administrateur qui explore un objet doit pouvoir déterminer rapidement qui a la possibilité de le modifier. À l’inverse, lorsqu’un administrateur examine les détails du jeu d’autorisations utilisateur, il doit pouvoir déterminer rapidement le périmètre qui utilisateur est attribué utilisateur les actions qu’il est autorisé à effectuer sur celui-ci.

Cela permet simplement de s'assurer que les bonnes personnes ont accès aux zones appropriées et disposent du niveau d'autorisation adapté à leur fonction au sein de l'entreprise.

Vous est-il déjà arrivé d'être confronté à un système d'autorisations tellement complexe qu'il était impossible de comprendre pourquoi un utilisateur autorisé à accéder à certaines informations ? Ou, au contraire, pourquoi il ne le pouvait pas ?

Simplicité d'administration

Enfin, un système de gestion des autorisations doit être capable de s'adapter à l'augmentation constante du volume du catalogue. Nous savons aujourd'hui que nous vivons dans un monde dominé par les données : 2,5 exaoctets de données ont été générés chaque jour en 2020, et on estime que ce chiffre atteindra 463 exaoctets par jour en 2025. Nouveaux projets, nouveaux produits, nouvelles utilisations : les entreprises doivent faire face quotidiennement à l'explosion de leurs ressources de données.

Pour rester pertinent, un catalogue de données doit évoluer avec les données de l'entreprise. Le système de gestion des autorisations doit donc pouvoir s'adapter aux changements de contenu ou même aux mouvements des employés au sein de l'organisation.

Différentes approches de la conception d'un système de gestion des permissions pour le catalogue de données

Il existe différentes approches pour concevoir un système de gestion des permissions du catalogue de données , qui répondent plus ou moins aux principales caractéristiques attendues et mentionnées ci-dessus. Nous avons choisi d'en détailler trois dans cet article.

Crowdsourcing

Tout d'abord, l'approche du crowdsourcing, qui repose sur la confiance accordée à la communauté pour qu'elle s'autocorrige. Une poignée d'administrateurs peut modérer le contenu, et tous les utilisateurs peuvent contribuer à la documentation. Un système d'audit vient généralement compléter le dispositif afin de s'assurer qu'aucune information n'est perdue par erreur ou par malveillance. Dans ce cas, il n'y a pas de contrôle avant la documentation, mais une correction collective après coup. C'est généralement le système choisi par les encyclopédies en ligne telles que Wikipédia. Le bon fonctionnement de ces systèmes dépend du nombre de contributeurs et de leurs connaissances, car l'autocorrection ne peut être efficace que par le biais de la collectivité.

Ce système répond parfaitement au besoin de lisibilité - tous les utilisateurs ont le même niveau de droits, il n'y a donc pas de question sur le contrôle d'accès de chaque utilisateur. Il est également simple à administrer - tout nouvel utilisateur a le même niveau de droits que tous les autres, et tout nouvel objet dans le catalogue de données est accessible à tous. En revanche, il n'existe aucun moyen de gérer la granularité des droits. Tout le monde peut tout faire et tout voir.

Autorisation jointe à l'utilisateur

La deuxième approche pour concevoir un système de gestion des autorisations consiste à utiliser des solutions dans lesquelles le périmètre est associé au profil utilisateur. Lorsqu'un utilisateur créé dans le catalogue de données, les administrateurs lui attribuent un périmètre qui définit les ressources qu'il pourra consulter et modifier. Dans ce cas, tous les contrôles sont effectués en amont, et un utilisateur accéder à une ressource par inadvertance. C'est le type de système utilisé par un système d'exploitation tel que Windows, par exemple.

Ce système présente l'avantage d'être très sécurisé ; il n'y a aucun risque qu'une nouvelle ressource soit visible ou modifiable par des personnes qui n'en ont pas le droit. Cette approche répond également au besoin de lisibilité : pour chaque utilisateur, toutes les ressources accessibles sont faciles à trouver. Le niveau de granularité attendu est également satisfaisant, puisqu'il est possible d'attribuer les données ressource par ressource.

En revanche, la gestion est plus complexe : chaque fois qu'une nouvelle ressource est ajoutée au catalogue, elle doit être intégrée aux périmètres d'accès des utilisateurs concernés. Il est possible de contourner cette limitation en créant des périmètres dynamiques. Pour ce faire, vous pouvez définir des règles qui attribuent des ressources aux utilisateurs ; par exemple, tous les fichiers PDF seront accessibles à untel. Mais des règles contradictoires peuvent facilement apparaître, ce qui complique la lisibilité du système.

Permission attachée à la ressource

La dernière approche majeure en matière de conception d'un système de gestion des autorisations catalogue de donnéesconsiste à recourir à des solutions dans lesquelles les actions autorisées sont associées à la ressource à modifier. Pour chaque ressource, les autorisations possibles sont définies utilisateur utilisateur. C'est donc la ressource qui dispose de son propre ensemble d'autorisations. En examinant la ressource, il est alors possible de savoir immédiatement qui peut la consulter ou la modifier. C'est, par exemple, le type de système utilisé par un système d'exploitation de type UNIX.

Le besoin de lisibilité est parfaitement satisfait - un administrateur peut immédiatement voir les autorisations des différents utilisateurs lorsqu'il consulte la ressource. Il en va de même pour le besoin de granularité - cette approche permet de donner des permissions au niveau le plus macro par un système d'héritage, ou au niveau le plus micro directement sur la ressource. Enfin, en termes de facilité d'administration, il est nécessaire d'attacher chaque nouvel utilisateur aux différentes ressources, ce qui est potentiellement fastidieux. Cependant, il existe des systèmes de groupes qui peuvent atténuer cette complexité.

Le catalogue de données gestion catalogue de données : simple, clair et flexible

Parmi ces approches, détaillons celle choisie par l'Actian Data Intelligence Platform et comment elle est appliquée.

L'approche par les ressources a été privilégiée

Résumons les différents avantages et inconvénients de chacune des approches discutées ci-dessus. Dans les systèmes de gestion des autorisations utilisateur ressources et des utilisateur, le besoin de granularité est bien pris en compte - ces systèmes permettent d'attribuer des autorisations ressource par ressource. En revanche, dans le cas du crowdsourcing, la philosophie de base est que tout le monde peut accéder à tout. La lisibilité est clairement meilleure dans les systèmes de crowdsourcing ou dans les systèmes où les permissions sont attachées à la ressource. Elle reste adéquate dans les systèmes où les autorisations sont liées à l'utilisateur, mais souvent au détriment de la simplicité d'administration. Enfin, la simplicité d'administration est très optimisée pour l'approche du crowdsourcing et dépend de ce que vous allez modifier le plus - la ressource ou les utilisateurs.

Le besoin de granularité n'étant pas satisfait dans l'approche du crowdsourcing, nous l'avons éliminé. Il nous restait alors deux options : les modèles de permission basés sur les ressources ou les modèles de permission utilisateur. Comme la lisibilité est un peu meilleure avec l'autorisation basée sur les ressources et que le contenu du catalogue évoluera plus vite que le nombre d'utilisateurs, l'option de l'autorisation utilisateur nous a semblé la moins pertinente.

L'option choisie par Actian Data Intelligence Platform est donc la troisième : les permissions de l utilisateur sont attachées à la ressource.

Fonctionnement du système de gestion des autorisations du catalogue de données

Dans catalogue de données de la plateforme Actian Data Intelligence, il est possible de définir utilisateur pour chaque utilisateur dispose du droit de manipuler les objets de l'ensemble du catalogue, un ou plusieurs types d'objets, ou uniquement ceux relevant de son périmètre. Cela permet une granularité optimale, mais aussi la définition de rôles plus généraux. Par exemple, les « super-stewards » pourraient être autorisés à intervenir sur des parties entières du catalogue, comme le glossaire.

Nous associons ensuite à chaque objet du catalogue une liste de conservateurs, c'est-à-dire de personnes responsables de la documentation de cet objet. Ainsi, en explorant simplement les détails de l'objet, on peut immédiatement savoir qui contacter pour corriger ou compléter la documentation, ou pour répondre à une question à son sujet. Le système est donc lisible et facile à comprendre. Le champ d'action des utilisateurs est précisément déterminé par un système granulaire, jusqu'à l'objet dans le catalogue.

Lorsqu'un nouvel utilisateur ajouté au catalogue, il est alors nécessaire de définir son champ d'action. Pour l'instant, cette configuration s'effectue via la modification groupée des objets. Afin de simplifier encore davantage la gestion, il sera bientôt possible de définir des groupes d'utilisateurs spécifiques, de sorte que lorsqu'un nouveau collaborateur arrive, il ne soit plus nécessaire de l'ajouter par son nom à chaque objet relevant de son champ d'action. Il suffira alors de l'ajouter au groupe, et son champ d'action lui sera automatiquement attribué.

Enfin, nous avons volontairement choisi de ne pas mettre en place workflow de validation de la documentation dans le catalogue. Nous estimons que la responsabilité de l'équipe est l'un des facteurs clés de la réussite de catalogue de données d'un catalogue de données . C'est pourquoi le seul contrôle que nous avons mis en place est celui qui détermine les droits et le périmètre utilisateur. Une fois ces deux éléments définis, les personnes chargées de la documentation sont libres d'agir. Le système est complété par un journal des événements relatant les modifications afin de garantir une traçabilité totale, ainsi que par un système de discussion sur les objets. Il permet à chacun de suggérer des modifications ou de signaler des erreurs dans la documentation.

Si vous souhaitez en savoir plus sur notre modèle de gestion des autorisations ou obtenir plus d'informations sur notre catalogue de données.