Por qué los desarrolladores de aplicaciones de software integrado optaron por los archivos planos

Recientemente, mi compañero de Actian Product Marketing, Pradeep Bhanot, escribió un excelente artículo de blog sobre los historiales de datos en el que abogaba por su sustitución por bases de datos más modernas que permitieran el procesamiento y el análisis de datos de series temporales. Sin embargo, en cierto modo, los historiales no son tan «históricos» como una de las soluciones de gestión de datos integradas más arraigadas: el archivo plano. De hecho, sospecho que el uso de archivos planos es mucho más frecuente que el de bases de datos o historiadores como medio de gestión de datos integrados. Es difícil de demostrar porque los analistas no lo registran como una categoría separada de soluciones de gestión de datos, tal y como hacen con las bases de datos o, por ejemplo, con los almacenes de datos en la nube. Pero la realidad es que están ahí; nos encontramos con clientes de nuestra base instalada, así como con clientes potenciales, que utilizan activamente archivos planos, y no solo en sus diseños más antiguos.

¿Por qué se generalizó tanto el uso de archivos planos en primer lugar?

Si eres desarrollador y estás escribiendo código para recopilar datos de tecnología operativa procedentes de sensores y otros sistemas periféricos, probablemente estés programando en C, C++, C# o algún otro lenguaje de programación que te permita acceder directamente a los datos recibidos de los dispositivos. Por ejemplo, en los viejos tiempos, cuando yo era ingeniero, utilizaba las instrucciones inp() y outp() (o, para delatar mi edad, una serie de registros a los que se accedía en ensamblador; ¡ay, creo que estoy sufriendo un trastorno de estrés postraumático!). Rápidamente te das cuenta de que necesitas un lugar y una forma de almacenar los datos de manera más permanente que la asignación de memoria temporal dentro de tu programa. La vía más fácil es un archivo. Al fin y al cabo, es el enfoque más sencillo y casi todo el mundo que asiste a alguna clase de programación o aprende por su cuenta sabe utilizar el sistema de archivos.

Los archivos planos eran «suficientes» para la gestión tradicional de datos integrados

Aunque lo anterior explica por qué existe la posibilidad de adoptarlos, no detalla por qué los archivos planos eran una buena solución en aquella época. Permíteme darte un par de razones clave por las que resultaban adecuados:

1. El «silo de las cosas» implicaba que toda la recopilación de datos se realizaba a nivel local

Los sistemas de archivos almacenan datos de forma local, lo cual resultaba más que suficiente para la mayoría de las aplicaciones con datos integrados en el perímetro, ya que estaban destinadas exclusivamente al uso local. No existía la necesidad de datos adicionales procedentes de flujos de datos paralelos, y mucho menos de fusionarlos con otros tipos de datos y compartirlos a través de redes. Por lo tanto, los sistemas de archivos independientes sin transferencia de datos por red eran suficientes. Las preocupaciones relativas a la transmisión de datos o al proceso de extracción, transformación y carga (ETL) a algún otro sistema no suponían un obstáculo importante.

2. No había tantos datos, ni tanto procesamiento de datos, ni tantos análisis

Hasta hace poco, la mayor parte de la tecnología operativa contaba con recursos informáticos muy limitados: microcontroladores de 32 o 16 bits, menos de un MB de DRAM y una memoria flash o EPROM reducida, etc. Si no conoces estos términos, piénsalo así: son como el Oldsmobile de tu padre. Con los recursos limitados disponibles, la mayor parte del software se utilizaba para controlar directamente el dispositivo en relación con un proceso específico, y los datos recopilados servían principalmente para respaldar ese proceso, no para la instrumentación del mismo ni para realizar análisis que informaran sobre las operaciones actuales o futuras de dicho proceso.

3. Son mis datos, soy el único que los usa, así que déjame en paz

¿Especificaciones de desarrollo de software? ¿Comentarios? ¿Quién necesita comentarios? Los desarrolladores de sistemas operativos suelen ser los únicos que utilizan el software que crean, y los datos generados por su código suelen ser vistos solo por ellos y, como mucho, por unos pocos expertos en validación de pruebas, por un lado, y en servicio y soporte técnico, por el otro. Una vez más, dado que los datos eran generados por ellos y para ellos, la necesidad de compartirlos con un analista de negocios o un científico de datos en la sede central —por no hablar de las unidades de negocio— habría parecido un poco descabellada. A los profesionales tradicionales de TI y ciberseguridad del centro de datos no se les pediría ni sentirían la necesidad de involucrarse en estos proyectos.

Respetemos el legado, pero avancemos hacia el futuro

Lo entiendo, yo mismo solía ser uno de esos ingenieros de sistemas operativos, como ya he mencionado antes. Si eres desarrollador de software, empezar con sistemas de archivos tiene algunas ventajas, pero, con el mundo cada vez más hiperconectado de los dispositivos periféricos de hoy en día —también conocido como IoT—, muchos más recursos (vaya, puedo conseguir una Raspberry Pi por menos de lo que cuesta un pastel de verdad), y la necesidad de compartir datos para impulsar la agilidad empresarial, la innovación y hacer que la OT sea más receptiva y menos costosa, es necesario un cambio. En la próxima entrega de esta serie hablaremos de por qué los desarrolladores de software de OT son reacios a abandonar sus sistemas de archivos planos y pasar a sistemas modernos de gestión de datos en el borde.

Actian es líder del sector en soluciones de almacenamiento de datos operativos y gestión de datos en el borde para empresas modernas. Con un conjunto completo de soluciones que le ayudan a gestionar datos en sus propias instalaciones, en la nube y en el borde mediante dispositivos móviles e IoT, Actian puede ayudarle a desarrollar la base técnica necesaria para lograr una verdadera agilidad empresarial. Para obtener más información, visite www.actian.com.