Integración Embarqué : La analítica computa donde están los datos
Corporación Actian
28 de enero de 2020

La selección de la mejor ubicación para su computación analítica plantea un interesante dilema que lleva a un debate reflexivo en algunas empresas, mientras que otras ni siquiera consideran el tema. Si trabaja con sistemas distribuidos, sensores Embarqué en maquinaria, aplicaciones móviles o dispositivos IoT, este tema es para usted. La ubicación de ressources de calcul para el análisis tiene un impacto significativo en el rendimiento de sus soluciones, la carga de su red y los costes del almacenamiento centralizado de datos (ya sea sur site o en la nube).
¿Qué es Analytics Compute?
En términos sencillos, el cómputo analítico es la capacidad de procesamiento de datos que se utiliza para convertir los datos brutos en información significativa. Los sistemas Embarqué generan datos a través de sensores o mediante registros de sus actividades. Estos datos tienen relevancia, pero no son muy útiles hasta que se procesan y se refinan para convertirlos en información y, más adelante, en perspectivas procesables. Ese proceso de refinamiento implica cosas como recopilar, filtrar, ordenar, clasificar, evaluar, interpretar y resumir flujos de datos utilizando reglas de negocio, algoritmos matemáticos, métodos estadísticos y plantillas de coincidencia de patrones. Cuando se aplican estas técnicas analíticas y reglas de negocio a los flujos de datos, se habla de computación analítica.
El dilema de dónde ubicar las capacidades informáticas
Los sistemas Embarqué también suelen ser sistemas distribuidos, es decir, que existen en muchos lugares diferentes dentro y fuera de la empresa. Las personas que necesitan comprender los datos generados por los sistemas Embarqué suelen estar centralizadas, en un edificio de oficinas alejado del sistema que genera los datos. Esto es importante porque los datos de los sistemas Embarqué no sólo tienen que ser refinados para convertirlos en información significativa, sino que también tienen que ser transportados desde su fuente original hasta la persona que necesita verlos. Aquí es donde surge el dilema: ¿dónde se deben realizar los análisis?
- ¿En la fuente, dentro del propio sistema Embarqué ?
- ¿En el borde de la red en un dispositivo de borde?
- ¿En la nube o en algún centro de datos centralizado?
- ¿En un almacén de datos on-prem o en la nube o en un entorno híbrido?
- En el sistema de informes, ¿dónde se va a consumir la información?
Cada una de estas opciones tiene sus ventajas e inconvenientes. Los centros de datos centralizados y los almacenes de datos en la nube son sistemas a gran escala que ofrecen economías de escala, lo que abarata los ressources de calcul . El problema es llevar los datos hasta ellos. Si transmite todos sus datos brutos a un servicio en la nube, a un almacén de datos o al escritorio de sus usuarios finales, está transmitiendo grandes cantidades de datos que realmente no necesita (datos que se filtrarán en los análisis). También supone una carga para su red, aumenta la latencia, incrementa sus costes de red y puede ralentizar otras actividades empresariales que necesiten utilizar esa capacidad. Si realiza operaciones de cálculo dentro del sistema Embarqué o en un dispositivo de borde, evitará el tráfico de red. Aun así, no obtiene las economías de escala y ressources de calcul son más caros.
Una regla general para una eficiencia óptima: "Ponga el cálculo analítico donde están los datos".
En términos relativos, ressources de calcul (incluso los distribuidos) son más baratos que la capacidad de red. La mayoría de los sistemas infrautilizan su capacidad de cálculo, lo que significa que tienes recursos por los que ya estás pagando y que se están desperdiciando. La regla general que recomiendan los expertos en datos es: "Coloque el cálculo analítico donde se encuentran los datos" o lo más cerca posible de ellos. Si los datos en bruto se generan en sistemas Embarqué , realice la mayor parte posible de los análisis sobre esos datos, ya sea en el sistema Embarqué o en un dispositivo de borde de red. Como mínimo, realice las tareas que filtren los datos innecesarios y reduzca el volumen de datos que deben transmitirse por la red.
Una vez que haya reducido los datos de flujo al realizar el primer nivel de procesamiento analítico sobre el terreno, probablemente necesitará combinar los datos de diferentes sistemas Embarqué o dispositivos distribuidos. La agregación de datos y los análisis posteriores no pueden realizarse de forma eficaz sobre el terreno y son más adecuados para un almacén de datos. Así que adelante, transmita sus datos (preprocesados) a un almacén de datos entrepôt de données cloud o sur site , donde podrá trabajar con los datos por lotes. El cálculo analítico de los datos almacenados en un almacén también debería realizarse lo más cerca posible de donde se encuentran los datos. Si puede realizar el cálculo en el mismo host físico, ¡genial! Si no, hágalo dentro de la misma ubicación del centro de datos para evitar latencia de red en su procesamiento.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.