7 mentiras de los catálogos de datos #5: No son una solución de modelado empresarial
Corporación Actian
9 de julio de 2021

El mercado de los catálogos de datos se ha desarrollado rápidamente, y ahora se considera esencial a la hora de desplegar una estrategia basada en datos. Víctima de su propio éxito, este mercado ha atraído a numerosos actores de mercados adyacentes.
Estos actores han reajustado su posicionamiento comercial para presentarse como soluciones de catálogos de datos.
La realidad es que, aunque relativamente débiles en cuanto a las funcionalidades del catálogo de datos en sí, estas empresas intentan convencer, con grados de éxito proporcionales a sus presupuestos de marketing, de que un catálogo de datos no es simplemente una herramienta de búsqueda de alto rendimiento para los equipos de datos, sino una solución integrada susceptible de abordar una gran cantidad de otros temas.
El objetivo de esta serie de blogs es deconstruir el discurso de estos proveedores de catálogos de datos de última hora.
Éstas son, en nuestra opinión, las 7 mentiras de los proveedores de Catálogos de Datos:
- Un catálogo de datos es una plataforma de gobernanza de datos.
- Un catálogo de datos puede medir y gestionar la calidad de los datos.
- Un catálogo de datos puede gestionar el cumplimiento de la normativa.
- Un catálogo de datos puede consultar los datos directamente.
- Un catálogo de datos puede modelar la arquitectura lógica y los procesos empresariales en torno a los datos.
- Un catálogo de datos es una herramienta de gestión colaborativa de cartografía y metadatos que no puede automatizarse.
- Un catálogo de datos es un proyecto largo, complejo y costoso.
Un catálogo de datos NO es una solución de modelado empresarial
Algunas organizaciones, normalmente las grandes, han invertido durante años en el modelado de sus procesos empresariales y su arquitectura de la información.
Han desarrollado varias capas de modelos (conceptuales, lógicos, físicos) y han puesto en marcha una organización que ayuda a mantener y compartir estos modelos con poblaciones específicas (expertos empresariales y personal informático, principalmente).
No cuestionamos el valor de estos modelos. Desempeñan un papel clave en la urbanización, los planos de esquemas, la gestión de SI, así como el cumplimiento de la normativa. Pero dudamos seriamente de que estas herramientas de modelización puedan proporcionar un Catálogo de Datos decente.
También hay un fenómeno de mercado en juego: algunos actores históricos de la modelización de negocio buscan ampliar el alcance de su oferta posicionándose en el mercado de los catálogos de datos. Al fin y al cabo, ya gestionan una gran cantidad de información sobre arquitectura física, clasificaciones empresariales, glosarios, ontologías, linaje de la información, procesos y roles, etc. Pero podemos identificar dos fallos importantes en su enfoque.
El primero es orgánico. Por su naturaleza, las herramientas de modelización producen modelos descendentes para esbozar la información de un SI. Por muy preciso que sea, un modelo no deja de ser un modelo: una representación simplificada de la realidad.
Son herramientas de comunicación muy útiles en diversos ámbitos, pero no son un reflejo exacto de la realidad operativa cotidiana que, para mí, es crucial para cumplir las promesas de un Catálogo de Datos (permitir a los equipos encontrar datos, comprender y saber cómo utilizar los conjuntos de datos).
¿El segundo defecto? No es fácil de usar.
Una herramienta de modelización es compleja y maneja un número importante de conceptos abstractos que requieren una curva de aprendizaje importante. Es una herramienta para expertos.
Podríamos plantearnos mejorar la facilidad de uso, por supuesto, para abrirla a un público más amplio. Pero la complejidad intrínseca de la información no desaparecerá.
Comprender la información que proporcionan estas herramientas requiere un sólido conocimiento de los principios del modelado (clases de objetos, niveles lógicos, nomenclaturas, etc.). Es todo un reto para los equipos de datos y un desafío que parece difícil de justificar desde una perspectiva operativa.
La verdad es que las herramientas de modelización convertidas en catálogos de datos se enfrentan a importantes problemas de adopción por parte de los equipos (tienen que hacer grandes esfuerzos para aprender a utilizar la herramienta, sólo para no encontrar lo que buscan).
Recientemente, un posible cliente nos presentó un metamodelo que había construido y nos preguntó si era posible implementarlo en la plataforma Actian Data Intelligence. Derivado de sus modelos de negocio, el metamodelo tenía varias docenas de clases de objetos y miles de atributos. A su pregunta, la respuesta oficial fue afirmativa (el metamodelo de la plataforma es muy flexible). Pero, en cambio, intentamos disuadirles de tomar ese camino: Un metamodelo tan sofisticado corría el riesgo, en nuestra opinión, de perder a los usuarios finales, y convertir el proyecto de Catálogo de Datos en un fracaso...
¿Debemos por tanto abandonar los modelos de negocio al implantar un catálogo de datos? En absoluto.
No obstante, hay que recordar que los modelos de negocio están ahí para gestionar algunas cuestiones, y el Catálogo de Datos otras. Cierta información contenida en los modelos ayuda a estructurar el catálogo y enriquece su contenido de forma muy útil (por ejemplo, responsabilidades, clasificaciones y, por supuesto, glosarios empresariales).
Por tanto, el mejor enfoque es, en nuestra opinión, concebir el metamodelo del catálogo centrándose exclusivamente en el valor añadido para los equipos de datos (siempre con la misma pregunta subyacente: ¿ayuda esta información a encontrar, localizar, comprender y utilizar correctamente los datos?), y después integrar la herramienta de modelado y el Catálogo de Datos para automatizar el suministro de determinados elementos del metamodelo ya presentes en el modelo de negocio.
Para llevar
Por muy útiles y completos que sean, los modelos de negocio siguen siendo sólo modelos: son un reflejo imperfecto de la realidad operativa de los sistemas y, por tanto, tienen dificultades para ofrecer un Catálogo de Datos útil.
Las herramientas de modelado, así como los modelos de negocio, son demasiado complejos y abstractos para que los adopten los equipos de datos. Nuestra recomendación es que defina el metamodelo de su catálogo con vistas a responder a las preguntas de los equipos de datos y suministre algunos aspectos del metamodelo con el modelo de negocio.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.