Inteligencia de datos

7 mentiras de los proveedores de catálogos de datos #1: No es una solución de gobierno de datos

Corporación Actian

16 de junio de 2021

un catálogo de datos no es una solución de gobernanza

El mercado de los catálogos de datos se ha desarrollado rápidamente, y ahora se considera esencial a la hora de desplegar una estrategia basada en datos. Víctima de su propio éxito, este mercado ha atraído a numerosos actores de mercados adyacentes.

 Estos actores han reajustado su posicionamiento comercial para presentarse como soluciones de catálogos de datos.

La realidad es que, aunque relativamente débiles en cuanto a las funcionalidades del catálogo de datos en sí, estas empresas intentan convencer, con grados de éxito proporcionales a sus presupuestos de marketing, de que un catálogo de datos no es simplemente una herramienta de búsqueda de alto rendimiento para los equipos de datos, sino una solución integrada susceptible de abordar una gran cantidad de otros temas.

El objetivo de esta serie de blogs es deconstruir el discurso de estos proveedores de catálogos de datos de última hora.

Un catálogo de datos NO es una solución de gobernanza de datos

Esta es probablemente nuestra postura más controvertida sobre el papel de un Catálogo de Datos y la controversia tiene su origen en los potentes mensajes de marketing que lanza el líder mundial en gestión de metadatos, cuya solución es en realidad una plataforma de gobierno de datos que se vende como Catálogo de Datos.

Para ser claros, contar con una sólida gobernanza de datos es uno de los pilares de una estrategia de datos eficaz. Sin embargo, la gobernanza tiene poco que ver con las herramientas.

Su principal objetivo es la definición de funciones, responsabilidades, políticas de empresa, procedimientos, controles, comités. En pocas palabras, su función es desplegar y orquestar, en su totalidad, el control interno de los datos en todas sus dimensiones.

Reconozcamos que la gobernanza de los datos tiene muchos aspectos diferentes (arquitectura de tratamiento y almacenamiento, clasificación, conservación, calidad, riesgo, conformidad, innovación, etc.) y que no existe ningún modelo universal "de talla única" adaptado a todas las organizaciones. Al igual que otros ámbitos de gobernanza, cada organización debe concebir y pilotar su propio panorama en función de sus capacidades y ambiciones, así como de un análisis de riesgos exhaustivo.

Poner en marcha una gobernanza de datos eficaz no es un proyecto, sino un programa de transformación.

Ninguna "solución" comercial puede sustituir ese esfuerzo de transformación.

¿Qué lugar ocupa el catálogo de datos en todo esto?

La búsqueda de un Catálogo de Datos suele ser el resultado de un requisito muy operativo: Una vez creado el Data Lake y una serie de herramientas de autoservicio, el siguiente reto consiste rápidamente en averiguar qué contiene realmente el Data Lake (tanto desde una perspectiva técnica como semántica), de dónde proceden los datos, qué transformaciones pueden haber sufrido, quién está a cargo de los datos, qué políticas internas se aplican a los datos, quién los utiliza actualmente y por qué, etc.

La incapacidad de proporcionar este tipo de información al usuario final puede tener graves consecuencias para una organización, y un Catálogo de Datos es el mejor medio para mitigar ese riesgo. Cuando se trata de la selección de una solución transversal, en la que participan personas de muchos departamentos diferentes, la selección de la solución suele recaer en los responsables del gobierno de datos, ya que parecen estar en la mejor posición para coordinar las expectativas del mayor número de interesados.

Aquí es donde empieza la alquimia. El Catálogo de Datos, cuyo propósito inicial era proporcionar a los equipos de datos una solución rápida para descubrir, explorar, comprender y explotar los datos, se convierte en un proyecto gargantuesco en el que hay que resolver todos los aspectos de la gobernanza.

El proyecto deberá:

  • Gestionar la calidad de los datos.
  • Gestionar los datos personales y el cumplimiento (GDPR ante todo).
  • Gestionar la confidencialidad, la seguridad y el acceso a los datos.
  • Proponer una nueva Gestión de Datos Maestros (MDM).
  • Garantizar un linaje automatizado campo por campo para todos los conjuntos de datos.
  • Apoyar todas las funciones definidas en el sistema de gobernanza y permitir la configuración del flujo de trabajo pertinente.
  • Integrar todos los modelos de negocio producidos en los últimos 10 años para el programa de urbanización.
  • Autorizar las consultas cruzadas sobre las fuentes de datos respetando la habilitación de los usuarios sobre esas mismas fuentes, así como la anonimización de los resultados.

Algunos proveedores consiguen convencer a sus clientes de que su solución puede ser esa ventanilla única para la gobernanza de datos. Si usted cree que esto es posible, llámelos, estarán encantados de atenderle. Pero, para ser francos, no creemos que una plataforma así sea posible, ni siquiera deseable. Demasiado compleja, demasiado rígida, demasiado cara y demasiado burocrática, este tipo de solución nunca podrá adaptarse a una organización centrada en los datos.

Para nosotros, el catálogo de datos desempeña un papel clave en un programa de gobernanza de datos. Este papel no debe implicar el apoyo a todos los aspectos de la gobernanza, sino que más bien debe utilizarse para facilitar la comunicación y el conocimiento de las normas de gobernanza dentro de la empresa y para ayudar a cada parte interesada a convertirse en una parte activa de esta gobernanza.

En nuestra opinión, un Catálogo de Datos es uno de los componentes que ofrece el mayor retorno de la inversión en organizaciones centradas en datos que confían en Data Lakes con canalizaciones de datos modernas... siempre que pueda desplegarse rápidamente y tenga un precio razonable asociado.

Para llevar

Un catálogo de datos no es una plataforma de gestión de gobernanza de datos.

La gobernanza de datos es esencialmente un programa de transformación con múltiples capas que no pueden abordarse con una única solución. En una organización centrada en los datos, la mejor forma de empezar, aprender, educar y mantenerse ágil es combinar unas directrices de gobierno claras con un catálogo de datos moderno que pueda compartir esas directrices con los usuarios finales.

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.