¿Qué es una malla de datos?

Formas y gráficos de datos SaaS sobre la imagen de una mujer en la tecnología

Una malla de datos es una arquitectura informática descentralizada que delega la propiedad de los activos de datos de una empresa en los departamentos y equipos expertos en sus datos. La tecnología proporciona las herramientas necesarias para que los expertos en el dominio publiquen sus propios datos y las herramientas de conectividad necesarias para acceder a los productos de datos que otros publican. La malla de datos utiliza un modelo de datos federados con dominios empresariales especializados como editores de datos para otros en la empresa.

¿Por qué utilizar esta arquitectura?

El problema de los almacenes de datos o lagos de datos tradicionales centralizados y gestionados por TI es que dependen de un equipo central que no es experto en todos los dominios. La avantage de una malla de datos es que delega la responsabilidad de publicar los datos en los expertos de cada dominio. Las funciones de ventas y finanzas son las que mejor conocen sus respectivos conjuntos de datos. Necesitan las herramientas de TI que les permitan conservar y publicar sus datos como un servicio para que toda la organización pueda avantage de datos precisos y de alta calidad procedentes de una fuente autorizada.

Los almacenes de datos y los data marts tradicionales pueden crear silos de datos que son utilizados isolement por el departamento o la línea de negocio a la que sirven. El problema de este enfoque es que fomenta la proliferación de grupos de datos inconexos que el resto de la empresa no puede aprovechar. La malla de datos desincentiva la duplicación de datos, centrando los recursos en menos fuentes de datos de mayor calidad porque los expertos en esos datos son los dueños de su mantenimiento.

Opera un bus de interoperabilidad universal en el que se conectan los distintos dominios empresariales. El almacén de datos departamental publica sus datos como producto utilizando el bus de interoperabilidad común.

La principal diferencia entre un tejido de datos y una malla de datos es que el tejido de datos no distribuye la propiedad de los datos, lo que tiene el inconveniente de depender de un equipo central que puede acumular trabajo.

La descubribilidad es una avantage esencial de una malla de datos. Los consumidores de datos pueden localizar rápidamente los datos que necesitan gracias al abundante uso de métadonnées en una malla de datos.

Los componentes de una malla de datos

Los componentes críticos incluyen:

  • Fuentes de datos que podrían ser almacenes de datos tradicionales.
  • Productos de datos como servicio específicos de un dominio.
  • Infraestructura de datos, como almacenes de datos y scripts, para construir e instanciar un servicio de productos de datos.
  • Normas y reglas gouvernance datos.
  • Controles y políticas de seguridad.
  • Las plataformas de streaming de eventos, como Kafka o Confluent Cloud, pueden formar parte de la infraestructura de malla de datos para capturar y distribuir cambios en los datos en tiempo real.
  • Qualité des données et conventions métadonnées .
  • Código: incluye canalizaciones de datos, controles de gouvernance , políticas e interfaces de aplicaciones.

Ventajas de la arquitectura de malla de datos

Las ventajas de una malla de datos son las siguientes:

  • Los expertos del sector comparten datos más significativos como servicio de productos de datos.
  • La empresa obtiene más valor de las fuentes de datos existentes compartiéndolas.
  • La descentralización de la gestion des données reduce los costes de mano de obra centralizada.
  • La seguridad puede aplicar políticas como el cifrado de datos en reposo y en movimiento.
  • Los datos son más fáciles de encontrar gracias a métadonnées.
  • Mejores productos de datos orientados al autoservicio.
  • Menos duplicación de datos.
  • Menos silos de datos.
  • Los proyectos de datos pueden ponerse en marcha más rápidamente, ya que hay menos datos que mover y transformar.
  • Las herramientas, normas y procesos compartidos aumentan los conocimientos sobre datos en toda la organización.
  • Menos retrasos centrales de TI para proyectos de almacenes de datos gracias a la democratización de los datos.
  • Los servicios modulares de productos de datos son más fáciles de consumir por las aplicaciones.
  • Mejora de la normalización de la calidad de los datos y de las prácticas gouvernance datos.
  • Las empresas obtienen más valor de sus activos de datos que mejoran la prise de décision basada en datos.

Actian apoya la implantación de mallas de datos

Actian Data Platform puede soportar múltiples almacenes de datos que una malla de datos puede compartir. Las instancias de la plataforma pueden alojarse in situ o en varias plataformas en la nube. Actian Data Platform cuenta con cientos de conectores predefinidos a fuentes, como NetSuite, Salesforce y ServiceNow. Está optimizada para respuestas de consulta de alta velocidad gracias a su base de datos vectorizada en columnas que supera a las alternativas. Actian Data Platform es ideal para almacenar datos antes de publicarlos como productos de datos dentro de un dominio.