Inteligencia de datos

Un sistema eficaz de gestión de permisos para un catálogo de datos

Corporación Actian

2 de diciembre de 2021

permission-management-sets-zeenea-data-catalog

El catálogo de datos de una organización mejora todos los activos de datos disponibles basándose en dos tipos de información: por un lado, la información puramente técnica que se sincroniza automáticamente a partir de sus fuentes y, por otro, la información empresarial que procede del trabajo de los Data Stewards. Esta última se actualiza manualmente y, por tanto, conlleva su cuota de riesgos para toda la organización.

Por lo tanto, un sistema de gestión de permisos es esencial para definir y controlar los derechos de acceso de los usuarios del catálogo. En este artículo, detallamos las características fundamentales y los posibles enfoques para construir un sistema de gestión de permisos eficiente, así como la solución implementada por el Catálogo de Datos de Actian Data Intelligence Platform.

Sistema de Gestión de Permisos: Una herramienta esencial para toda la organización

Para que los usuarios del catálogo de datos confíen en la información que consultan, es esencial que la documentación de los objetos catalogados sea pertinente, de alta calidad y, sobre todo, fiable. Sus usuarios deben poder encontrar, comprender y utilizar fácilmente los activos de datos que tienen a su disposición.

El origen de la información por catálogo y la automatización

Un catálogo de datos suele integrar dos tipos de información. Por un lado, está la información puramente técnica que procede directamente de la fuente de datos. Esta información se sincroniza de forma totalmente automatizada y continua entre el catálogo de datos y cada fuente de datos, para garantizar su veracidad y frescura. Por otro lado, el catálogo contiene toda la documentación de negocio u organizativa, que proviene del trabajo de los Data Stewards. Esta información no puede automatizarse, sino que es actualizada manualmente por los equipos de gestión de datos de la empresa.

Un sistema de gestión de permisos es un requisito previo para utilizar un catálogo de datos

Para gestionar esta segunda categoría de información, el catálogo debe incluir mecanismos de control de acceso y de entrada. En efecto, no es deseable que cualquier usuario del catálogo de datos de su organización pueda crear, editar, importar, exportar o incluso suprimir información sin haber recibido una autorización previa. Por lo tanto, un sistema de gestión de permisos basado en el usuario es un requisito previo; desempeña el papel de un guardia de seguridad para los derechos de acceso de los usuarios.

Las 3 características fundamentales del sistema de gestión de permisos de un catálogo de datos

La implantación de un sistema de gestión de permisos en toda la empresa está sujeta a una serie de expectativas que deben tenerse en cuenta en su diseño. Entre ellas, en este artículo hemos optado por centrarnos en tres características fundamentales de un sistema de gestión de permisos: su nivel de granularidad y flexibilidadsu legibilidad y auditabilidad, y su facilidad de administración.

Granularidad y flexibilidad

En primer lugar, un sistema de gestión de permisos debe tener el nivel adecuado de granularidad y flexibilidad. Algunas acciones deben estar disponibles para todo el catálogo para facilitar su uso. Otras acciones deben estar restringidas sólo a ciertas partes del catálogo. Algunos usuarios tendrán derechos globales relacionados con todos los objetos del catálogo, mientras que otros se limitarán a editar únicamente el perímetro que se les haya asignado. Por tanto, el sistema de gestión de permisos debe permitir este abanico de posibilidades, desde el permiso global hasta la finura de un objeto del catálogo.

Nuestros clientes son de todos los tamaños, con niveles muy heterogéneos de madurez en materia de gobernanza de datos. Algunos son start-ups, otros son grandes empresas. Algunos tienen una cultura de datos que ya está bien integrada en sus procesos, mientras que otros sólo están al principio de su proceso de aculturación de datos. Por lo tanto, el sistema de gestión de permisos debe ser lo suficientemente flexible como para adaptarse a todo tipo de organizaciones.

Legibilidad y auditabilidad

En segundo lugar, un sistema de gestión de permisos debe ser legible y fácil de seguir. Durante una auditoría, o una revisión de los permisos del sistema, un administrador que explore un objeto debe poder determinar rápidamente quién tiene capacidad para modificarlo. A la inversa, cuando un administrador examina los detalles del conjunto de permisos de un usuario, debe poder determinar rápidamente el ámbito asignado a ese usuario y sus acciones autorizadas sobre él.

Esto simplemente garantiza que las personas adecuadas tengan acceso a los perímetros correctos y dispongan del nivel de permiso adecuado para su función en la empresa.

¿Alguna vez se ha encontrado ante un sistema de permisos tan complejo que resultaba imposible comprender por qué un usuario podía acceder a una información? ¿O por el contrario era incapaz de hacerlo?

Simplicidad de administración

Por último, un sistema de gestión de permisos debe ser resistente para hacer frente al creciente volumen de catálogos. Hoy sabemos que vivimos en un mundo de datos: En 2020 se generaron 2,5 exabytes de datos al día y se calcula que en 2025 se generarán 463 exabytes de datos al día. Nuevos proyectos, nuevos productos, nuevos usos: las empresas deben hacer frente a diario a la explosión de sus activos de datos.

Para seguir siendo relevante, un catálogo de datos debe evolucionar con los datos de la empresa. Por tanto, el sistema de gestión de permisos debe ser resistente a los cambios de contenido o incluso a los movimientos de los empleados dentro de la organización.

Diferentes enfoques para diseñar un sistema de gestión de permisos para catálogos de datos

Existen diferentes enfoques para diseñar un sistema de gestión de permisos de catálogos de datos, que cumplen más o menos las principales características esperadas y mencionadas anteriormente. Hemos elegido detallar tres de ellos en este artículo.

Crowdsourcing

En primer lugar, el enfoque de crowdsourcing, en el que se confía en que el colectivo se autocorrige. Un puñado de administradores puede moderar el contenido y todos los usuarios pueden contribuir a la documentación. Un sistema de auditoría suele completar el sistema para asegurarse de que no se pierde información por error o malicia. En este caso, no hay control antes de documentar, sino una corrección colectiva después. Este suele ser el sistema elegido por enciclopedias en línea como Wikipedia. Estos sistemas dependen del número de colaboradores y de sus propios conocimientos para funcionar bien, ya que la autocorrección sólo puede ser eficaz a través del colectivo.

Este sistema responde perfectamente a la necesidad de legibilidad: todos los usuarios tienen el mismo nivel de derechos, por lo que no hay dudas sobre el control de acceso de cada uno. También es sencillo de administrar: cualquier nuevo usuario tiene el mismo nivel de derechos que los demás, y cualquier nuevo objeto del catálogo de datos es accesible para todos. Por otro lado, no hay forma de gestionar la granularidad de los derechos. Todo el mundo puede hacer y ver todo.

Permiso vinculado al usuario

El segundo enfoque para diseñar el sistema de gestión de permisos consiste en utilizar soluciones en las que el perímetro está vinculado al perfil del usuario. Cuando se crea un usuario en el catálogo de datos, los administradores le asignan un perímetro que define los recursos que podrá ver y modificar. En este caso, todos los controles se realizan en sentido ascendente y un usuario no puede acceder a un recurso de forma inadvertida. Este es el tipo de sistema utilizado por un sistema operativo como Windows, por ejemplo.

Este sistema tiene la ventaja de ser muy seguro, no hay riesgo de que un nuevo recurso sea visible o modificable por personas que no tengan derecho a hacerlo. Este enfoque también responde a la necesidad de legibilidad: para cada usuario, todos los recursos accesibles son fáciles de encontrar. El nivel de granularidad esperado también es bueno, ya que es posible asignar el sistema de datos recurso por recurso.

Por otro lado, la administración es más compleja: cada vez que se añade un nuevo recurso al catálogo, hay que añadirlo a los perímetros de dichos usuarios. Es posible superar esta limitación creando ámbitos dinámicos. Para ello, se pueden definir reglas que asignen recursos a usuarios, por ejemplo, todos los archivos PDF serán accesibles para fulano de tal. Pero es fácil que aparezcan reglas contradictorias, lo que complicaría la legibilidad del sistema.

Permiso asociado al recurso

El último gran enfoque para diseñar el sistema de gestión de permisos de un catálogo de datos consiste en utilizar soluciones en las que las acciones autorizadas se adjuntan al recurso que se va a modificar. Para cada recurso, los permisos posibles se definen usuario por usuario. Así, es el recurso el que tiene su propio conjunto de permisos. Observando el recurso, es posible saber inmediatamente quién puede verlo o modificarlo. Este es, por ejemplo, el tipo de sistema de un SO tipo UNIX.

La necesidad de legibilidad se satisface perfectamente - un administrador puede ver inmediatamente los permisos de los diferentes usuarios al visualizar el recurso. Lo mismo ocurre con la necesidad de granularidad - este enfoque permite dar permisos al nivel más macro a través de un sistema de herencia, o al nivel más micro directamente en el recurso. Por último, en cuanto a la facilidad de administración, es necesario asociar cada nuevo usuario a los distintos recursos, lo que puede resultar tedioso. Sin embargo, existen sistemas de grupos que pueden mitigar esta complejidad.

El modelo de gestión de permisos del catálogo de datos: Sencillo, legible y flexible

Entre estos enfoques, vamos a detallar el elegido por Actian Data Intelligence Platform y cómo se aplica.

Se prefirió el enfoque basado en los recursos

Resumamos las distintas ventajas y desventajas de cada uno de los enfoques discutidos anteriormente. Tanto en los sistemas de gestión de permisos a nivel de recursos como a nivel de usuario, la necesidad de granularidad está bien resuelta: estos sistemas permiten asignar permisos recurso por recurso. En cambio, en el caso del crowdsourcing, la filosofía básica es que cualquiera puede acceder a cualquier cosa. La legibilidad es claramente mejor en los sistemas de crowdsourcing o en los sistemas en los que los permisos están vinculados al recurso. Sigue siendo adecuada en los sistemas en los que los permisos están vinculados al usuario, pero a menudo a expensas de la simplicidad de la administración. Por último, la sencillez de administración está muy optimizada para el enfoque de crowdsourcing y depende de lo que se vaya a modificar más: el recurso o los usuarios.

Dado que la necesidad de granularidad no se satisface en el enfoque de crowdsourcing, lo eliminamos. Nos quedaban entonces dos opciones: modelos de permisos basados en recursos o en usuarios. Como la legibilidad es un poco mejor con el permiso basado en recursos, y como el contenido del catálogo evolucionará más rápido que el número de usuarios, la opción de permiso basado en usuarios parecía la menos pertinente.

La opción que hemos elegido en Actian Data Intelligence Platform ha sido, por tanto, la tercera: los permisos de usuario se adjuntan al recurso.

Cómo funciona el sistema de gestión de permisos del catálogo de datos

En el Catálogo de Datos de Actian Data Intelligence Platform, es posible definir para cada usuario si tiene derecho a manipular los objetos de todo el catálogo, uno o varios tipos de objetos, o sólo los de su perímetro. Esto permite la granularidad más fina, pero también roles más globales. Por ejemplo, los "supergestores" podrían tener permiso para actuar sobre partes enteras del catálogo, como el glosario.

A continuación, asociamos a cada objeto del catálogo una lista de conservadores, es decir, los responsables de documentar ese objeto. Así, basta con explorar los detalles del objeto para saber inmediatamente a quién dirigirse para corregir o completar la documentación, o para responder a una pregunta sobre él. El sistema es, por tanto, legible y fácil de entender. El ámbito de actuación de los usuarios se determina con precisión mediante un sistema granular, hasta el objeto en el catálogo.

Cuando se añade un nuevo usuario al catálogo, es necesario definir su ámbito de actuación. Por el momento, esta configuración se realiza mediante la edición masiva de objetos. Para simplificar aún más la gestión, pronto será posible definir grupos específicos de usuarios, de modo que cuando llegue un nuevo colaborador ya no sea necesario añadirlo por su nombre a cada objeto de su ámbito. Basta con añadirlos al grupo y se les asignará automáticamente su ámbito.

Por último, hemos optado voluntariamente por no implantar un flujo de trabajo de validación de la documentación en el catálogo. Creemos que la responsabilidad del equipo es una de las claves del éxito de la adopción de un catálogo de datos. Por eso, el único control que implantamos es el que determina los derechos y el alcance del usuario. Una vez determinados estos dos elementos, los responsables de la documentación son libres de actuar. El sistema se completa con un registro de eventos sobre las modificaciones para permitir una auditabilidad completa, así como un sistema de discusión sobre los objetos. Permite a todo el mundo sugerir cambios o informar de errores en la documentación.

Si desea obtener más información sobre nuestro modelo de gestión de permisos, u obtener más información sobre nuestro Catálogo de datos.

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, cubrimos temas que van desde la ingestión de datos en tiempo real hasta el análisis impulsado por IA.