¿Qué hace que un catálogo de datos sea "inteligente"? #1 - Metamodelado
Corporación Actian
16 de febrero de 2022

Un catálogo de datos aprovecha enormes cantidades de información muy diversa, y su volumen crecerá exponencialmente. Esto planteará 2 grandes retos:
- ¿Cómo alimentar y mantener el volumen de información sin triplicar (o más) el coste de la gestión de metadatos?
- ¿Cómo encontrar los conjuntos de datos más pertinentes para un caso de uso específico?
Creemos que un catálogo de datos debería ser inteligente para responder a estas 2 preguntas, con características tecnológicas y conceptuales inteligentes que vayan más allá de la mera integración de algoritmos de IA.
A este respecto, hemos identificado 5 áreas en las que un catálogo de datos puede ser "inteligente", la mayoría de las cuales no implican aprendizaje automático:
- Metamodelado
- El inventario de datos
- Gestión de metadatos
- El motor de búsqueda
- Experiencia del usuario
Un metamodelo universal y estático no puede ser inteligente
A escala empresarial, los metadatos necesarios para aprovechar de manera significativa los activos informativos pueden ser considerables. Y además, los metadatos son específicos de cada organización, a veces incluso entre distintas poblaciones dentro de una misma organización. Por ejemplo, un analista de negocio no buscará necesariamente la misma información que un ingeniero o un jefe de producto.
Intentar crear un metamodelo universal, por tanto, no nos parece muy inteligente. En efecto, un metamodelo de este tipo tendría que adaptarse a una plétora de situaciones diferentes, e inevitablemente será víctima de uno de los 3 escollos que se exponen a continuación:
- Simplicidad excesiva que no cubrirá todos los casos de uso necesarios.
- Niveles de abstracción excesivos con la posibilidad de adaptarse a diversos contextos a costa de una formación ardua y lenta: no es la situación ideal para implantar un catálogo en toda la empresa.
- Los niveles de abstracción carentes de profundidad y que conducen en última instancia a una multiplicidad de conceptos concretos se basan en una combinación de nociones que emanan de una variedad de contextos diferentes, muchos de los cuales serán inútiles en cualquier contexto específico, haciendo que el metamodelo sea innecesariamente complicado y potencialmente incomprensible.
En nuestra opinión, el metamodelado inteligente debe garantizar un metamodelo que se adapte a cualquier contexto y pueda enriquecerse a medida que los casos de uso o los niveles de madurez evolucionan con el tiempo.
El enfoque orgánico de un metamodelo
Un metamodelo es un campo de conocimiento y la estructura formal de un modelo de conocimiento se denomina ontología.
Una ontología define una serie de clases de objetos, sus atributos y las relaciones entre ellos. En un modelo universal, la ontología es estática: las clases, los atributos y las relaciones están predefinidos, con distintos niveles de abstracción y complejidad.
Actian Data Intelligence Platform optó por no basarse en una ontología estática, sino en un grafo de conocimiento escalable.
El metamodelo es, por tanto, voluntariamente sencillo al principio: sólo hay un puñado de tipos, que representan las distintas clases de activos de información (fuentes de datos, conjuntos de datos, campos, cuadros de mando), cada uno con unos pocos atributos esenciales (nombre, descripción, contactos).
Este metamodelo se alimenta automáticamente de los metadatos técnicos extraídos de las fuentes de datos, que varían en función de la tecnología de que se trate (los metadatos técnicos de una tabla en un almacén de datos difieren de los metadatos técnicos de un archivo en un lago de datos).
Este metamodelado orgánico es la forma más inteligente de tratar la cuestión de la ontología en un catálogo de datos. De hecho, ofrece varias ventajas:
- El metamodelo puede adaptarse a cada contexto, a menudo basándose en un modelo preexistente, integrando la nomenclatura y la terminología internas sin necesidad de una curva de aprendizaje larga y costosa;
- No es necesario definir completamente el metamodelo antes de utilizar el catálogo de datos: sólo tendrá que centrarse en unas pocas clases de objetos y en los pocos atributos necesarios para cubrir los casos de uso iniciales. A continuación, podrá cargar el modelo a medida que la adopción del catálogo progrese con el tiempo;
- Los comentarios de los usuarios pueden integrarse progresivamente, lo que mejora la adopción del catálogo y, en consecuencia, garantiza el retorno de la inversión en la gestión de metadatos.
Añadir atributos funcionales al metamodelo para facilitar la búsqueda
Este enfoque del metamodelo tiene ventajas considerables, pero también un gran inconveniente: como el metamodelo es completamente dinámico, es difícil que el motor comprenda la estructura y, por tanto, que ayude a los usuarios a alimentar el catálogo y a utilizar los datos (dos componentes básicos de un catálogo de datos inteligente).
Parte de la solución está relacionada con el metamodelo y los atributos de la ontología. Normalmente, los atributos del metamodelo se definen por sus tipos técnicos (fecha, número, cadena de caracteres, lista de valores, etc.). Con Actian Data Intelligence Platform, estos tipos de biblioteca incluyen, por supuesto, estos tipos técnicos.
Pero también incluyen tipos funcionales: niveles de calidad, niveles de confidencialidad, toque personal, etc. Estos tipos funcionales permiten al motor de la plataforma comprender mejor la ontología, afinar los algoritmos y adaptar la representación de la información.
Para más información sobre cómo inteligente Metamodeling mejora un Catálogo de Datos, descargue nuestro eBook: "¿Qué es un Catálogo de Datos Inteligente?".
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.