Inteligencia de datos

Todo lo que hay que saber sobre un Data Fabric

Corporación Actian

13 de abril de 2022

Tejido de datos

Ya en 2019, Gartner identificó el concepto de Data Fabric como una de las principales tendencias tecnológicas para 2022. Detrás de esta palabra de moda se esconde un objetivo importante: maximizar el valor de tus datos y acelerar tu transformación digital. Solo tienes que descubrir cómo siguiendo esta guía.

Poner orden en los datos es la promesa de Data Fabric. Sin embargo, no se trata simplemente de una solución para organizar o estructurar la información. Un Data Fabric es una herramienta diseñada para dar valor a sus datos. En efecto, el volumen de datos generados por las empresas crece exponencialmente. Cada segundo hay más datos que explotar y que permiten a las organizaciones ser más eficientes y estar más en sintonía con su mercado o con sus clientes. Las cifras hablan por sí solas: IDC estima que en 2025 el volumen de datos generados a nivel mundial alcanzará los 175 zettabytes. Un volumen tan grande que, si se almacenara en Blu-ray, representaría una pila de discos 23 veces la distancia de la Tierra a la Luna.

¿Qué es Data Fabric?

Gartner define Data Fabric como "un concepto de diseño que actúa como una capa integrada de datos y procesos de conexión". En otras palabras, un Data Fabric analiza continuamente combinaciones de activos de metadatos existentes, accesibles e inferidos para proporcionar información más inteligente y apoyar las tareas de gestión de datos de forma más eficiente. A continuación, un Data Fabric utiliza todo este análisis de metadatos para diseñar nuevos procesos y establecer un acceso estandarizado a los datos para todos los perfiles de negocio de la empresa: desarrolladores de aplicaciones, analistas, científicos de datos, etc.

Un Data Fabric es, por tanto, una serie de procesos que leen, capturan, integran y entregan datos basándose en la comprensión de quién los utiliza, la clasificación de los tipos de uso y la supervisión de los cambios en los patrones de uso de los datos.

Ventajas de una estructura de datos para las empresas

Gartner explica que para 2024, el despliegue de Data Fabrics en las organizaciones cuadruplicará la eficiencia en la explotación de los datos, al tiempo que reducirá a la mitad las tareas de gestión de datos realizadas por humanos. En este sentido, el instituto identifica tres grandes áreas de oportunidad que aporta un Data Fabric:

  1. Una reducción del 70% en las tareas de descubrimiento, análisis e integración de datos para los equipos de datos. para los equipos de datos;
  2. El aumento del número de usuarios de datosal reutilizar los datos para un mayor número de casos de uso;
  3. La capacidad de obtener más de más datos acelerando considerablemente la introducción y explotación de datos secundarios y de terceros.

Desde el punto de vista tecnológico, un Data Fabric se adapta a las herramientas ya existentes en una organización. Puede evolucionar a partir de las herramientas existentes de integración y calidad, gestión de datos y plataformas de gobernanza (como un registro de datos, por ejemplo - volveremos sobre esto). En este sentido, su modelo de diseño es ideal, ya que utiliza la tecnología existente al tiempo que persigue un cambio estratégico en la gestión global de los datos.

Por último, un Data Fabric ayuda a las empresas a romper los silos de datos. Así pueden reducir el coste y el esfuerzo de sus equipos de datos, que deben fusionar, refundir y volver a desplegar constantemente silos de gestión de datos con nuevos silos.

La contribución de un catálogo de datos a un tejido de datos

Si tomamos la noción de "capa integrada" de la definición de un Data Fabric así como del diagrama propuesto por Gartner (más abajo) como guía, observamos que un catálogo de datos desempeña un papel fundamental en la constitución de un Data Fabric. En efecto, influye en las capas superiores que forman un Data Fabric eficaz.

Nivel 1 - Acceso a todos los tipos de metadatos

Un catálogo de datos es la base de una estructura Data Fabric: es la primera capa (gris). Permite identificar, recopilar y analizar todas las fuentes de datos y todos los tipos de metadatos. El catálogo de datos es el punto de partida de un Data Fabric.

Capa 2 - Habilitación de metadatos y grafo de conocimiento

En la segunda capa de un Data Fabric (amarillo), Garner se centra en activación de metadatos. Esta activación implica el análisis continuo de metadatos para calcular indicadores clave. Este análisis se ve facilitado por el uso de la inteligencia artificial (IA), el aprendizaje automático (ML) y la integración automatizada de datos.

Los patrones y conexiones detectados se retroalimentan al catálogo de datos y otras herramientas de gestión de datos para hacer recomendaciones a las personas y máquinas implicadas en la gestión e integración de datos. Esto requiere un análisis continuo a partir de un grafo de conocimiento conectado: los medios para crear y visualizar las relaciones existentes entre activos de datos de distintos tipos, darles un sentido empresarial y hacer que este conjunto de relaciones sea fácil de descubrir y navegar por todos los usuarios de la organización.

Capa 3 - Integración dinámica de datos

La tercera capa de Gartner (azul) se refiere principalmente a los consumidores técnicos de datos en las organizaciones. Esta capa de Data Fabric se refiere a la necesidad de preparar, integrar, explorar y transformar los datos. El reto consiste en hacer accesibles los activos de datos de una amplia gama de herramientas a un amplio abanico de usuarios empresariales. Las palabras clave aquí son flexibilidad y compatibilidad para romper los silos de datos, con las siguientes características:

    • Un sistema de gestión de conjuntos de permisos de datos: el Data Fabric debe automatizar el acceso del usuario.
    • Aprovisionamiento automatizado: Cualquier persona de la organización debe poder solicitar acceso a un conjunto de datos desde Data Fabric, mediante la creación de tickets con funciones integradas de gobernanza de datos.
    • Una herramienta de exploración de datos: El Data Fabric debe permitir a los usuarios explorar los datos (no sólo los metadatos) sin tener que salir del tejido.

La orquestación automatizada de datos -como se describe en la parte superior de esta tercera capa del diagrama- se refiere a DataOps. Se trata de una práctica colaborativa de gestión de datos destinada a mejorar la comunicación, la integración y la automatización de los flujos de datos entre los gestores de datos y los consumidores de datos dentro de una organización. Puede leer más al respecto en este artículo.

¿Existe una única herramienta para implantar un tejido de datos?

Como señala Gartner, no existe una única herramienta que soporte todas las capas del tejido de forma integral. En este sentido ningún proveedor es capaz de ofrecer una estructura de datos que pueda equipararse a un Data Fabric completo. La solución reside en la interacción entre las distintas capas. Una plataforma abierta es la clave, y las empresas deben dotarse de las mejores herramientas de datos interconectadas para lograr un Data Fabric digno de su nombre. La construcción de un Data Fabric debe considerarse un maratón, no un sprint, y abordarse por etapas: el catálogo de datos es la primera.

Creación de un tejido de datos

Las empresas que han adoptado nuestro Smart Data Catalog ya han sentado las bases de su Data Fabric. En efecto, además de la identificación, recopilación y análisis de todas las fuentes de datos, así como de todos los tipos de metadatos (primera capa), Actian Data Intelligence Platform ofrece todas las funcionalidades necesarias para la activación de los metadatos a través de su núcleo: mediante un grafo de conocimiento (segunda capa). Por último, nuestro catálogo aborda la tercera capa: por un lado, a través de la integración de reglas de gobierno de datos; por otro lado, a través de la aplicación Actian Explorer, que actúa como un verdadero mercado de datos para que cada usuario de negocio pueda acceder fácilmente a los conjuntos de datos clave que le interesan y, de este modo, crear valor rápidamente a partir de los datos disponibles.

Para obtener más información sobre nuestro catálogo Smart Data, consulte nuestros dos libros electrónicos o póngase en contacto con nosotros:

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.