¿Qué es un Edge Data Fabric?

¿Qué es un Edge Data Fabric?

Un tejido de datos es una arquitectura de datos, prácticas de gestión y políticas para ofrecer un conjunto de servicios de datos que abarcan todos estos dominios y puntos finales. Los tejidos de datos proporcionan ese marco. En esencia, sirven de traductor y de tubería para los datos en todas sus formas, dondequiera que se encuentren y dondequiera que necesiten ir, independientemente de si el consumidor de datos es un ser humano o una máquina.

Los tejidos de datos no son nuevos, pero de repente están recibiendo mucha atención en TI en estos días en que las empresas se mueven a la nube múltiple y al borde. Esto se debe a que las organizaciones necesitan desesperadamente un marco para gestionarlos: moverlos, protegerlos, prepararlos, gobernarlos e integrarlos en los sistemas de TI.

Los tejidos de datos empezaron a utilizarse a mediados de la década de 2000, cuando la informática empezó a extenderse de los centros de datos a la nube. Se hicieron más populares cuando las organizaciones adoptaron las nubes híbridas, y hoy los tejidos de datos están ayudando a reducir las complejidades que implican los flujos de datos que se mueven hacia y desde el borde de la red. Pero los postes de la portería se han movido, el borde de la red es ahora el IoT, etiquetado colectivamente como "el borde".

Lo que es diferente es de dónde emanarán los datos y lo fluidos que serán. En otras palabras, el móvil y el IoT -el borde- impulsarán la creación de datos. Además, el procesamiento y el análisis se llevarán a cabo en varios puntos: en el dispositivo, en las pasarelas y en la nube. ¿Quizás sería mejor hablar de Fluid Distributed Data en lugar de Big Data?

En cualquier caso, más datos se traducen en última instancia en más oportunidades de negocio viables, sobre todo teniendo en cuenta que estos nuevos datos se generan en el punto de acción de personas y máquinas. Para aprovechar al máximo la creciente cantidad de datos de que disponen, las empresas necesitan una forma de gestionarlos de manera más eficiente en todas las plataformas, desde el perímetro hasta la nube y viceversa. Necesitan procesar, almacenar y optimizar diferentes tipos de datos que proceden de distintas fuentes con diferentes niveles de limpieza y validez para poder conectarlos a las aplicaciones internas y aplicar la lógica de los procesos empresariales, cada vez más asistidos por modelos de inteligencia artificial y aprendizaje automático.

Es un gran reto. Una de las soluciones que las empresas están adoptando ahora es una estructura de datos. Y, a medida que los volúmenes de datos sigan creciendo en el borde de la red, esa solución evolucionará hasta convertirse en lo que más comúnmente se denominará un tejido de datos de borde.

Cómo se aplica Data Fabric a la periferia

La computación periférica plantea una serie de retos únicos para los datos que se generan y procesan fuera del núcleo de la red. Los propios dispositivos que operan en el perímetro son cada vez más complejos. Dispositivos inteligentes como PLC en red gestionan solenoides que, a su vez, controlan los flujos de procesos en una planta química, sensores de presión que determinan el peso y etiquetas RFID activas para determinar la ubicación de un contenedor de carga. La mayor parte del procesamiento solía tener lugar en el centro de datos, pero ha cambiado hasta el punto de que una mayor parte del procesamiento tiene lugar en la nube. En ambos casos, el procesamiento tiene lugar a un lado de una pasarela. El centro de datos era fijo, no virtual, pero la nube es fluida. Si se tiene en cuenta la definición de nube, se puede ver por qué se necesitaría un tejido de datos en ella. La nube tiene que ver con la fluidez y la eliminación de la localidad, pero, al igual que el centro de datos, tiene que ver con el procesamiento de datos asociados a las aplicaciones. Puede que no nos importe dónde se encuentra realmente la nube de Salesforce u Oracle o cualquier otra nube, pero sí nos importa que mis datos deban transitar entre varias nubes y persistir en cada una de ellas para su uso en distintas operaciones.

Debido a toda esa complejidad, las organizaciones tienen que determinar qué partes del procesamiento se realizan en cada nivel. Hay una aplicación para cada uno, y para cada aplicación hay una manipulación. Y para cada manipulación, hay procesamiento de datos y gestión de memoria.

El objetivo de una estructura de datos es gestionar toda la complejidad. Spark, por ejemplo, sería un elemento clave de un tejido de datos en la nube, ya que se ha convertido rápidamente en la forma más fácil de soportar el flujo de datos entre varias plataformas en la nube de diferentes proveedores. El borde se está convirtiendo rápidamente en una nueva nube, aprovechando las mismas tecnologías y estándares de la nube en combinación con nuevas redes específicas del borde, como 5G y WLAN 6. Y, al igual que la nube central, hay aplicaciones más ricas e inteligentes que se ejecutan en cada dispositivo, en las puertas de enlace y en lo que habría sido el equivalente del centro de datos que se ejecuta en un armario de abrigos en la planta de la fábrica, en un avión, en un buque de carga, etc. Es lógico pensar que se necesitará un tejido de datos de borde análogo al que se está solidificando en la nube central.

Elementos comunes de Edge Data Fabric

Para gestionar el creciente número de requisitos de datos que plantean los dispositivos periféricos, un tejido de datos periféricos tiene que realizar varias funciones importantes. Tiene que ser capaz de:

Acceso a muchas interfaces diferentes: http, mttp, redes de radio, redes de fabricación.
Funciona en múltiples entornos operativos: Y lo que es más importante, compatible con POSIX.
Trabaja con protocolos y API clave: Incluidas las más recientes con API REST.
Proporcionar conectividad de base de datos JDBC/ODBC: Para aplicaciones heredadas y una conexión rápida y sucia entre bases de datos.
Manejar datos en streaming: A través de estándares como Spark y Kafka.

Conclusión

El tejido de datos no es un único producto, plataforma o conjunto de servicios, como tampoco lo es el tejido de datos de borde. Edge data fabric es una extensión de data fabric pero, dadas las diferencias en recursos y requisitos en el edge, se requiere un cambio suficiente en lo necesario para gestionar los datos edge. En el próximo blog analizaremos por qué es importante el edge data fabric y por qué ahora.

Acerca del autor