Es hora de que los historiadores de datos se conviertan en... Historia
Corporación Actian
17 de julio de 2021

Historiadores de bases de datos... ¿Historia?
Por qué una base de datos moderna con capacidad para series temporales puede simplificar y mejorar el análisis de datos de series temporales.
A pesar de la imagen catedrática que sugiere el término, un historiador de datos no es un instructor o investigador, sino una solución de software creada a propósito. Y la evolución en la forma de utilizar y gestionar los datos operativos ha eclipsado la necesidad de soluciones de software para historiadores de datos.
¿Qué es un historiador de datos?
Existen muchos entornos de tecnología operativa (OT) en los sectores de la fabricación, el petróleo y el gas, la investigación en ingeniería e innumerables industrias más. En estos entornos, equipos complejos, maquinaria y redes de sensores y dispositivos generan datos de series temporales. Estos flujos de series temporales van desde datos de sensores que representan presión, volumen y temperatura hasta flujos de vídeo para visión artificial y vigilancia.
Inicialmente, estos flujos eran ignorados o muestreados sólo a bajas tasas periódicas. A medida que los flujos de series temporales aumentaban en volumen y el procesamiento local de datos incorporaba la conciliación de múltiples fuentes, los ingenieros de OT comenzaron a construir sistemas de recopilación, agregación y procesamiento mínimo de datos para manejar mejor estos flujos de datos de series temporales. Con el tiempo, estos sistemas patentados y hechos a medida se denominaron colectivamente historiadores de datos.
La brecha en el proceso del historiador de datos
Tanto el uso como los usuarios de los datos de OT han cambiado mucho en los últimos años. Cada vez más, los datos de OT son aprovechados por una serie de otros actores dentro de una organización más allá de los profesionales de OT. Entre estos nuevos usuarios se incluyen desarrolladores, analistas de negocio y científicos de datos que dan soporte al OT, y gestores de productos y servicios que dirigen el negocio.
Sin embargo, ninguna solución de software de historiador de datos se había diseñado para su uso con una serie de sistemas externos o por usuarios que no fueran profesionales de la terapia ocupacional. En su lugar, la plataforma típica de historiador de datos era poco más que bibliotecas de datos recopilados por profesionales de OT y destinados únicamente a su uso. Y normalmente construían cada solución de software de historiador de datos desde cero, directamente o por delegación a través de proveedores de fabricación u otros equipos especializados. En esencia, las soluciones de historiales de datos son bibliotecas construidas sólo para los bibliotecarios.
Además, gran parte del software historiador de datos se implementaba en un costoso hardware heredado. La escasez de recursos y la falta de normas implicaban que la funcionalidad se reducía y se centraba únicamente en los requisitos localizados e inmediatos de la infraestructura de OT y el proceso en cuestión. El resultado es que las soluciones de software de historiales de datos no son fáciles de ampliar para funciones como el análisis y la visualización localizados o el intercambio de datos entre sistemas locales. También es difícil o imposible que la plataforma típica de historiador de datos intercambie datos de forma fácil y segura con sistemas backend modernos para su posterior análisis y visualización.
Tecnología que permite a los datos históricos moldear el futuro
Como ocurre con cualquier otro sector de la industria empresarial y de TI, la tecnología para la gestion des données evoluciona continuamente y cada día surgen nuevas capacidades. En la actualidad, tres cambios tecnológicos principales se están combinando para ir más allá de las capacidades y los resultados esperados del software historiador de datos.
Bases de datos de series temporales modernas: Más allá del historiador de datos
Fuera del dominio OT, el resto de los datos de su empresa probablemente se almacenan en bases de datos relacionales tradicionales y almacenes de datos. Las soluciones de historiales de datos se centraban en capturar datos estructurados en gran medida en formatos de series temporales. Los datos actuales son un amplio superconjunto de los datos capturados por estos sistemas heredados.
Las bases de datos de series temporales modernas incluyen capacidades de datos de series temporales tradicionales. Sin embargo, esas soluciones modernas están diseñadas y optimizadas para capturar la cronología de los datos e ingerir datos de fuentes de datos de flujo no estructurados y con múltiples variables. Estas pueden ir desde objetos binarios de gran tamaño (BLOB) y datos conformes con el estándar abierto JavaScript Open Notation (JSON) hasta lo último en conectividad del Internet de las cosas (IoT).
Análisis e informes ad hoc: los datos adecuados para todos
Los historiadores de datos tienden a confiar en las interfaces de programación de aplicaciones (API) NoSQL. Éstas almacenan y acceden a los datos basándose en los llamados "valores clave", en lugar de en las filas y columnas de las bases de datos tradicionales. Las API NoSQL son excelentes para la recopilación de datos y la gestion des données local gestion des données. Sin embargo, no son fácilmente accesibles para el análisis y la elaboración de informes ad hoc posteriores a la recopilación, especialmente por parte de analistas empresariales y científicos de datos ajenos al ámbito de las OT.
Las bases de datos de series temporales modernas ofrecen tanto una API NoSQL como API conformes con la norma Structured Query Language (SQL) del American National Standards Institute (ANSI). Esta última característica facilita la extracción de datos para apoyar el análisis ad hoc a distancia, la elaboración de informes y la visualización a través de herramientas de informatique décisionnelle y elaboración de informes ampliamente utilizadas que se basan en mecanismos de conectividad de TI estándar, como Java Database Connectivity (JDBC) y Open Database Connectivity (ODBC).
Inteligencia Artificial (IA): La historia al servicio de la predicción del futuro
Las soluciones tradicionales de historiadores de datos pueden permitir a los responsables de operaciones sobre el terreno detectar problemas en sus infraestructuras, como cuando la presión es demasiado alta o una pieza ha fallado. Pero estas alertas son siempre a posteriori. La velocidad de recopilación y procesamiento de la solución específica de historiador de datos determina en cierto modo la rapidez a posteriori, pero la retrospectiva es siempre la norma.
La IA, impulsada por las modernas capacidades de aprendizaje automático (ML), puede ofrecer alertas más perspicaces. Dependiendo de las combinaciones de datos, patrones anteriores y la capacidad de analizarlos, los sucesores impulsados por IA de las soluciones de historiales de datos pueden incluso ofrecer orientación predictiva sobre cuándo es probable que falle una pieza. Las bases de datos de series temporales modernas e integradas pueden respaldar las capacidades de IA y ML localmente en el punto de acción dentro del dominio de OT mediante la integración de OT con TI de backend. El resultado es que los científicos e ingenieros de datos pueden crear capacidades de IA y ML para los sistemas de TI de backend. A continuación, los desarrolladores y los ingenieros de OT front-end pueden invocar esas capacidades en el entorno de OT. Este enfoque proporciona una forma nueva y moderna de interactuar con los datos de su empresa para generar perspectivas más útiles y mejores resultados.
Respetar el legado, pero avanzar hacia el futuro
Las soluciones de historiadores de datos han sido cruciales para la evolución de la OT y la industria de TI desde los años 80 y antes, y sus contribuciones deben ser reconocidas y respetadas. Sin embargo, su tiempo ha pasado y las soluciones tecnológicas modernas las están sustituyendo. Éstas le permiten gestionar mejor los datos que su empresa necesita hoy y disponer de información más rápida, completa y precisa para el futuro.
Actian es el líder del sector en soluciones de almacén de datos operativos y gestion des données en el perímetro para empresas modernas. Con un conjunto completo de soluciones para ayudarle a gestionar los datos sur site, en la nube y en el perímetro, incluidos los dispositivos móviles y de IoT. Actian puede ayudarle a desarrollar la base técnica que necesita para respaldar una verdadera agilidad empresarial. Para obtener más información, visite www.actian.com.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.