eBook

¿Qué es un catálogo inteligente de datos?

La idea de un catálogo de datos inteligente lleva varios años presente en la literatura relacionada con la gestión de metadatos, aunque no existe una definición oficial. El consenso general es que un catálogo de datos moderno debe contar con aprendizaje automático e inteligencia artificial para desarrollar todo su potencial.

Este eBook cinco áreas clave en las que un catálogo de datos puede demostrar capacidades «inteligentes», muchas de las cuales van más allá del aprendizaje automático:

  • Metamodelado
  • Inventario de datos
  • Gestión de metadatos
  • Motor de búsqueda
  • Experiencia del usuario

Consiga su eBook

Esta extensión de correo electrónico () no está permitida. Por favor, actualícela.
Este dominio de dirección de correo electrónico personal () no está permitido. Por favor, actualícelo.
Correo electrónico válido
Cargando...
Correo electrónico no válido
Introduzca un correo electrónico
Introduzca un correo electrónico empresarial
No se permiten cuentas de rol 
(por ej., ventas@..., asistencia@...)
Demasiados intentos, pruebe otra vez más tarde

Vista previa del eBook

Visión general

Independientemente de su tamaño, un sistema de información contiene varias docenas de sistemas y aplicaciones que almacenan datos a través de una amplia variedad de fuentes (bases de datos relacionales y no relacionales, sistemas de archivos distribuidos, API, soluciones en la nube, etc.), de acuerdo con protocolos, formatos y reglas específicos. Cada sistema gestiona cientos o miles de conjuntos de datos, normalmente tablas o archivos, que a su vez están compuestos por docenas de campos (o columnas). Y cada conjunto de datos y cada campo se alimenta de un metamodelo (es decir, un conjunto de metadatos estructurados) que hace posible la exploración de datos.

En última instancia, un catálogo de datos tendrá que aprovechar enormes cantidades de información muy diversa, y su volumen crecerá exponencialmente, al igual que el volumen de datos utilizables. Este volumen de información planteará dos problemas importantes:

  • Cómo alimentar y mantener el volumen de información sin triplicar (o más) el coste de la gestión de metadatos.
  • Cómo encontrar los conjuntos de datos más relevantes para cualquier caso de uso específico.

Para nosotros, un catálogo de datos inteligente debe tener un alcance mucho más amplio que la integración de algoritmos de IA y debe incluir una serie de características tecnológicas y conceptuales inteligentes que proporcionen respuestas a las dos preguntas anteriores.