Inteligencia de datos

7 mentiras de los catálogos de datos #5: No son una solución de modelado empresarial

Corporación Actian

9 de julio de 2021

un catálogo de datos no es una solución de modelado empresarial

El mercado de los catálogos de datos se ha desarrollado rápidamente, y ahora se considera esencial a la hora de desplegar una estrategia basada en datos. Víctima de su propio éxito, este mercado ha atraído a numerosos actores de mercados adyacentes.

 Estos actores han reajustado su posicionamiento comercial para presentarse como soluciones de catálogos de datos.

La realidad es que, aunque relativamente débiles en cuanto a las funcionalidades del catálogo de datos en sí, estas empresas intentan convencer, con grados de éxito proporcionales a sus presupuestos de marketing, de que un catálogo de datos no es simplemente una herramienta de búsqueda de alto rendimiento para los equipos de datos, sino una solución integrada susceptible de abordar una gran cantidad de otros temas.

El objetivo de esta serie de blogs es deconstruir el discurso de estos proveedores de catálogos de datos de última hora.

Un catálogo de datos NO es una solución de modelado empresarial

Algunas organizaciones, normalmente las grandes, han invertido durante años en el modelado de sus procesos empresariales y su arquitectura de la información.

Han desarrollado varias capas de modelos (conceptuales, lógicos, físicos) y han puesto en marcha una organización que ayuda a mantener y compartir estos modelos con poblaciones específicas (expertos empresariales y personal informático, principalmente).

No cuestionamos el valor de estos modelos. Desempeñan un papel clave en la urbanización, los planos de esquemas, la gestión de SI, así como el cumplimiento de la normativa. Pero dudamos seriamente de que estas herramientas de modelización puedan proporcionar un Catálogo de Datos decente.

También hay un fenómeno de mercado en juego: algunos actores históricos de la modelización de negocio buscan ampliar el alcance de su oferta posicionándose en el mercado de los catálogos de datos. Al fin y al cabo, ya gestionan una gran cantidad de información sobre arquitectura física, clasificaciones empresariales, glosarios, ontologías, linaje de la información, procesos y roles, etc. Pero podemos identificar dos fallos importantes en su enfoque.

El primero es orgánico. Por su naturaleza, las herramientas de modelización producen modelos descendentes para esbozar la información de un SI. Por muy preciso que sea, un modelo no deja de ser un modelo: una representación simplificada de la realidad.

Son herramientas de comunicación muy útiles en diversos ámbitos, pero no son un reflejo exacto de la realidad operativa cotidiana que, para mí, es crucial para cumplir las promesas de un Catálogo de Datos (permitir a los equipos encontrar datos, comprender y saber cómo utilizar los conjuntos de datos).

¿El segundo defecto? No es fácil de usar.

Una herramienta de modelización es compleja y maneja un número importante de conceptos abstractos que requieren una curva de aprendizaje importante. Es una herramienta para expertos.

Podríamos plantearnos mejorar la facilidad de uso, por supuesto, para abrirla a un público más amplio. Pero la complejidad intrínseca de la información no desaparecerá.

Comprender la información que proporcionan estas herramientas requiere un sólido conocimiento de los principios del modelado (clases de objetos, niveles lógicos, nomenclaturas, etc.). Es todo un reto para los equipos de datos y un desafío que parece difícil de justificar desde una perspectiva operativa.

La verdad es que las herramientas de modelización convertidas en catálogos de datos se enfrentan a importantes problemas de adopción por parte de los equipos (tienen que hacer grandes esfuerzos para aprender a utilizar la herramienta, sólo para no encontrar lo que buscan).

Recientemente, un posible cliente nos presentó un metamodelo que había construido y nos preguntó si era posible implementarlo en la plataforma Actian Data Intelligence. Derivado de sus modelos de negocio, el metamodelo tenía varias docenas de clases de objetos y miles de atributos. A su pregunta, la respuesta oficial fue afirmativa (el metamodelo de la plataforma es muy flexible). Pero, en cambio, intentamos disuadirles de tomar ese camino: Un metamodelo tan sofisticado corría el riesgo, en nuestra opinión, de perder a los usuarios finales, y convertir el proyecto de Catálogo de Datos en un fracaso...

¿Debemos por tanto abandonar los modelos de negocio al implantar un catálogo de datos? En absoluto.

No obstante, hay que recordar que los modelos de negocio están ahí para gestionar algunas cuestiones, y el Catálogo de Datos otras. Cierta información contenida en los modelos ayuda a estructurar el catálogo y enriquece su contenido de forma muy útil (por ejemplo, responsabilidades, clasificaciones y, por supuesto, glosarios empresariales).

Por tanto, el mejor enfoque es, en nuestra opinión, concebir el metamodelo del catálogo centrándose exclusivamente en el valor añadido para los equipos de datos (siempre con la misma pregunta subyacente: ¿ayuda esta información a encontrar, localizar, comprender y utilizar correctamente los datos?), y después integrar la herramienta de modelado y el Catálogo de Datos para automatizar el suministro de determinados elementos del metamodelo ya presentes en el modelo de negocio.

Para llevar

 Por muy útiles y completos que sean, los modelos de negocio siguen siendo sólo modelos: son un reflejo imperfecto de la realidad operativa de los sistemas y, por tanto, tienen dificultades para ofrecer un Catálogo de Datos útil.

Las herramientas de modelado, así como los modelos de negocio, son demasiado complejos y abstractos para que los adopten los equipos de datos. Nuestra recomendación es que defina el metamodelo de su catálogo con vistas a responder a las preguntas de los equipos de datos y suministre algunos aspectos del metamodelo con el modelo de negocio.

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.