Inteligencia de datos

¿Qué es un atalogue de données?

Corporación Actian

12 de febrero de 2019

¿Qué es una cubierta de aterrizaje de un catálogo de datos?

No es ningún secreto que los enormes volúmenes de información que generan las empresas requieren las herramientas adecuadas para gestionarlos correctamente. De hecho, los grandes datos conllevan una gran responsabilidad. Para que las organizaciones saquen verdadero provecho de sus datos, es esencial dotarse de una solución que permita a las personas orientadas a los datos encontrar, descubrir, gestionar y, sobre todo, confiar fácilmente en sus activos de información.

Un catálogo de datoscreado para unificar todos los datos de la empresa, permite a los gestores de datos y a los usuarios mejorar la productividad y la eficacia a la hora de trabajar con sus datos.

En 2017, Gartner declaró los catálogos de datos como "el nuevo negro en la gestión y el análisis de datos". En "Augmented Data Catalogs: Now an Enterprise Must-Have for Data and Analytics Leaders", afirman:

"La demanda de catálogos de datos se está disparando, ya que las organizaciones siguen luchando por encontrar, inventariar y analizar activos de datos enormemente distribuidos y diversos."

En este artículo, compartiremos todo lo que hay que saber sobre los catálogos de datos para las empresas que buscan convertirse realmente en data-driven.  

¿Qué es exactamente un atalogue de données?

Antes de entrar en el tema de la catalogación de datos, es importante entender el concepto de gestión de metadatos. Un catálogo de datos utiliza metadatos - datos sobre datos - para crear un repositorio de búsqueda de todos los activos de información de la empresa. Estos metadatos, recogidos por diversas fuentes de datos (Big Data, servicios en la nube, hojas de Excel, etc.) se escanean automáticamente para permitir a los usuarios del catálogo buscar sus datos y obtener información como la disponibilidad, frescura y calidad de un activo de datos.

Por tanto, por definición, un catálogo de datos se ha convertido en un estándar para la gestión eficaz de metadatos. A grandes rasgos, definimos un catálogo de datos como:

"Un inventario detallado de todos los activos de datos de una organización y sus metadatos, diseñado para ayudar a los profesionales de datos a encontrar rápidamente los datos más apropiados para cualquier propósito empresarial analítico."

¿Para qué sirve un catálogo de datos?

Los temas relacionados con los datos siguen considerándose un ámbito extremadamente técnico. Sin embargo, la innovación en materia de datos sólo es posible si la comparte el mayor número posible de personas. Este es el objetivo de un catálogo de datos: democratizar el acceso a los datos. democratizar el acceso a los datos.

Un catálogo de datos está pensado para servir a diferentes personas o usuarios finales. Todos estos usuarios finales -analistas de datos, administradores de datos, científicos de datos, analistas de negocio, etc.- tienen diferentes expectativas, necesidades, perfiles y formas de entender los datos. Como cada vez son más las personas que utilizan y trabajan con datos, un catálogo de datos debe adaptarse a todos los usuarios finales. De hecho, los catálogos de datos no requieren conocimientos técnicos para buscar, descubrir y comprender el panorama de datos de una empresa.

¿Cuáles son las ventajas de un catálogo de datos?

Como ya se ha mencionado, un catálogo de datos centraliza y unifica los metadatos recopilados para que puedan compartirse con los equipos de TI y las funciones empresariales. Esta visión unificada de los datos permite a las organizaciones:

Acelerar el descubrimiento de datos

A medida que se crean miles de conjuntos de datos y activos cada día, las empresas se encuentran con dificultades para comprender y obtener información de su información para crear valor. Muchas encuestas recientes siguen afirmando que los equipos de ciencia de datos dedican el 80 % de su tiempo a preparar y ordenar sus datos en lugar de analizarlos e informar sobre ellos. Al implementar un catálogo de datos, la velocidad de descubrimiento de datos puede aumentar hasta 5 veces. De este modo, los equipos de datos pueden centrarse en lo importante: entregar sus proyectos de datos a tiempo.

Mantener una cultura de datos

Al igual que la cultura organizativa o cultura corporativala cultura de datos se refiere a un entorno de trabajo en el que las decisiones se toman a través de pruebas de datos empíricas y enfáticas. Un catálogo de datos permite que el conocimiento de los datos ya no se limite a un grupo de expertos: permite a las organizaciones colaborar mejor en sus activos de información.

Construir una gobernanza de datos ágil

En lugar de implantar procesos demasiado complejos y difíciles de mantener sobre información asumida, los catálogos de datos permiten un enfoque de gobernanza de datos ascendente y ágil. Un catálogo de datos permite a los usuarios de datos crear un registro de procesos de datos, documentar las obligaciones legales, realizar un seguimiento del ciclo de vida de los datos, así como identificar la información sensible. Todo ello en un único repositorio centralizado.

Maximizar el valor de los datos

Al recopilar todos los datos de una empresa en una herramienta de datos de referencia, es posible cruzar estos activos y obtener valor de ellos más fácilmente. La colaboración de equipos técnicos y profesionales dentro del catálogo de datos permite innovaciones que responden a necesidades probadas del mercado.

Producir mejor y más rápido

Más del 70% del tiempo dedicado al análisis de datos se invierte en actividades de "disputa de datos". La catalogación simplifica la recuperación de datos, la identificación de contactos asociados y, por tanto, la toma de decisiones basada en datos.

Garantizar un buen control de los datos

Malinterpretados o erróneos, las empresas se exponen al riesgo de basar sus decisiones en información incorrecta. Los catálogos de datos conectados permiten acceder a datos siempre actualizados. Los usuarios de datos pueden asegurarse de que los datos y su información son correctos y utilizables.

¿Cuáles son las principales características de un catálogo de datos?

Una plantilla de metamodelos flexible y adaptable

Un catálogo de datos debe capturar y actualizar automáticamente los metadatos de las fuentes de datos de una empresa. A través de una plantilla de metamodelo flexible, debería ser posible añadir, configurar -de la mano del administrador del catálogo de datos- y superponer propiedades de documentación a los conjuntos de datos catalogados. Mediante este enfoque, el catálogo ofrece una forma sencilla y modular de configurar plantillas de documentación en función de los objetivos y prioridades de la empresa.

Un motor de búsqueda inteligente

Una de las principales características de un catálogo de datos es su motor de búsqueda. Todos los metadatos indexados deben poder buscarse a través de una barra de búsqueda. Mediante simples búsquedas de palabras clave, un catálogo de datos debe ser capaz de mostrar los resultados más precisos a una consulta. También debe permitir a los usuarios filtrar los resultados de sus búsquedas. Un motor de búsqueda inteligente también optimiza los resultados en función del perfil y las preferencias del usuario. Así, un motor de búsqueda inteligente permite a los usuarios encontrar rápidamente sus activos de información.

Un gráfico del conocimiento

La presencia de un grafo de conocimiento es esencial para cualquier proyecto de catalogación de datos. El grafo de conocimiento es lo que representa los diferentes conceptos y lo que vincula los objetos entre sí a través de enlaces semánticos o estáticos. Por lo tanto, el grafo de conocimiento de un catálogo de datos proporciona a los usuarios resultados de búsqueda ricos y profundos, descubrimiento de datos optimizado, recomendaciones inteligentes, etc.

Linaje de datos

Con linaje de datoses posible visualizar en su totalidad el origen y las transformaciones de un dato concreto a lo largo del tiempo. Esto permite a los usuarios comprender de dónde proceden los datos, cuándo y dónde se separan y fusionan con otros datos. Estas transformaciones y tratamientos realizados por los datos son indispensables para ajustarse al GDPR y a otras normativas sobre datos.

Glosario empresarial

A glosario empresarial permite a los consumidores de datos gestionar un vocabulario empresarial común y ponerlo a disposición de toda la organización. Esta característica imprescindible proporciona un significado y un contexto claros a los términos de datos.

¿Cuáles son los casos de uso de un catálogo de datos? ¿Y para quién?

Para responsables de datos

En Director de Datos desempeña un papel clave en la estrategia global de datos de una empresa; su propósito es dominar sus datos y facilitar su acceso para convertirse en una empresa basada en datos. Un catálogo de datos les ayuda:

  • Garantizar la fiabilidad y el valor de los datos.
  • Crear un organización de datos.
  • Valorizar el contexto de un conjunto de datos para los exploradores de datos.
  • Evangelizar una cultura de datos con derechos y deberes.
  • Iniciar un proceso de cumplimiento de la normativa europea (GDPR).

Para administradores de datos

Conocido como el principal contacto para las consultas sobre datos gracias a sus conocimientos técnicos y operativos, el Responsable de datos recibe el apodo de "maestro de datos". Un catálogo de datos permite a los administradores de datos:

  • Centralice el conocimiento de los datos en una única plataforma.
  • Enriquecer la documentación de los datos.
  • Establecer la comunicación entre ellos y los exploradores de datos.
  • Cualificar el valor de los datos.

Para científicos de datos

Para cumplir sus misiones, los usuarios finales deben poder encontrar, descubrir y comprender rápidamente los activos de datos adecuados para sus casos de uso. Un catálogo de datos les ayuda:

  • Encuentre datos fácilmente a través de un motor de búsqueda
  • Ver el historial de su información: fecha de creación y acciones realizadas sobre ella
  • Comprender el contexto de sus datos
  • Identificar a las personas asociadas
  • Colabora fácilmente con tus compañeros.

Un viaje representativo del catálogo de datos

Un catálogo de datos resulta extremadamente útil en las distintas fases de sus proyectos:

Un catálogo de datos en la fase de implantación

Conéctese a sus fuentes de datos - Un catálogo de datos se conecta a todas sus fuentes de datos. Conecte sus soluciones de integración de datos, preparación de datos, visualización de datos, CRM, etc. para integrar completamente todas sus tecnologías en una única fuente de verdad.

Un catálogo de datos en la fase de documentación

Crear un metamodelo - Un catálogo de datos captura y actualiza los metadatos técnicos y operativos de las fuentes de datos de una empresa. Permite añadir y configurar -de la mano del administrador del catálogo de datos- o superponer información (información que puede ser obligatoria o no) sobre sus conjuntos de datos catalogados.

Un catálogo de datos en la fase de descubrimiento

Comprenda sus datos - Con un catálogo de datos, los ciudadanos de datos -con capacidades técnicas o no- pueden comprender plenamente los datos de su empresa. Un catálogo de datos permite a los usuarios acceder y buscar fácilmente cualquier información dentro del catálogo.

Defina sus datos - Un catálogo de datos permite a los líderes de datos, como los administradores de datos o los directores de datos, definir correctamente los datos pertinentes que se van a utilizar. A través de los metadatos, los gestores de datos pueden documentar fácilmente sus conjuntos de datos, lo que permite a sus equipos de datos acceder a datos contextualizados.

Explore sus datos - Descubra y recopile los datos disponibles en un catálogo de datos. Al catalogar todos los datos de la empresa en un repositorio central, los ciudadanos de datos pueden asegurarse de que sus datos son fiables y utilizables.

Un catálogo de datos en la fase de colaboración

Comunicarse con los datos - Un catálogo de datos permite a los usuarios utilizar los datos con fluidez. Tanto los departamentos de TI como los de negocio son capaces de entender y comunicarse en torno a diferentes proyectos de datos. Gracias a funciones de colaboración como los debates, los datos se convierten en un tema que todos pueden compartir en toda la empresa.

Comience su viaje de catalogación

La Plataforma de Inteligencia de Datos Actian es una solución 100% basada en la nube, disponible en cualquier parte del mundo con sólo unos clics. Al elegir Actian Data Intelligence Platform, proporciona a sus equipos de datos el mejor entorno de próxima generación para encontrar, comprender y utilizar sus activos de datos.

Consulte nuestras dos aplicaciones:

  • Actian Studio - Permita a sus equipos de gestión de datos gestionar, mantener y enriquecer la documentación de los activos de datos de su empresa.
  • Actian Explorer - Proporcione a sus equipos de datos una interfaz fácil de usar y rutas de exploración personalizadas para que su descubrimiento de datos sea más eficiente.
logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, cubrimos temas que van desde la ingestión de datos en tiempo real hasta el análisis impulsado por IA.