Inteligencia de datos

Revoluciones de datos: Hacia una visión empresarial de los datos

Corporación Actian

19 de agosto de 2019

revoluciones de datos

El uso de datos masivos por parte de los gigantes de Internet en la década de 2000 fue una llamada de atención para las empresas: Los macrodatos son una palanca de crecimiento y competitividad que fomenta la innovación. Hoy, las empresas se reorganizan en torno a sus datos para adoptar un enfoque "data-driven". Es una historia con varios giros que tiende a encontrar finalmente una solución.

Este artículo analiza las distintas revoluciones de datos empresariales emprendidas en los últimos años hasta la fecha en un intento de maximizar el valor empresarial de los datos.

Arquitecturas aisladas

En los años 80, los Sistemas de Información se desarrollaron enormemente. Se crearon aplicaciones empresariales, surgieron lenguajes de programación avanzados y aparecieron las bases de datos relacionales. Todas estas aplicaciones permanecían en las plataformas de sus propietarios, aisladas del resto del ecosistema informático. 

Por estas razones históricas y tecnológicas, los datos internos de una empresa se distribuían en diversas tecnologías y en formatos heterogéneos. Además de los problemas organizativos, hablamos entonces de un efecto tribal. Cada departamento informático dispone de sus propias herramientas y gestiona implícitamente sus propios datos para sus propios usos. Asistimos a una especie de acaparamiento de datos en las organizaciones. Para respaldar estas sugerencias, recordamos con frecuencia la ley de Conway: "Toda arquitectura refleja la organización que la creó". Así, esta organización, denominada silos, hace muy complejas y onerosas referencias cruzadas de datos procedentes de dos sistemas diferentes.

La búsqueda de una visión centralizada y global de los datos de una empresa llevará a los Sistemas de Información a una nueva revolución.

El concepto de almacén de datos

A finales de los años 90, el Business Intelligence estaba en pleno apogeo. Con fines analíticos y con la intención de responder a todas las cuestiones estratégicas, apareció el concepto de almacén de datos. 

Para ello, recuperaremos los datos de mainframes o bases de datos relacionales y los transferiremos a un ETL (Extract Transform Loader). Proyectados en un formato denominado pivote, los analistas y responsables de la toma de decisiones pueden acceder a los datos recogidos y formateados para responder a preguntas preestablecidas y a casos concretos de reflexión. A partir de la pregunta, se obtiene un modelo de datos.

Esta revolución siempre viene acompañada de algún problema. El uso de herramientas ETL tiene un cierto coste, por no hablar del hardware que lo acompaña. El tiempo transcurrido entre la formalización de la necesidad y la recepción del informe lleva mucho tiempo. Es una revolución costosa para una eficacia perfectible.

La nueva revolución de un lago de datos

La llegada de los lagos de datos invierte el razonamiento anterior. Un lago de datos permite a las organizaciones centralizar todos los almacenamientos de datos útiles, independientemente de su origen o formato, por un coste muy bajo. . Almacenamos los datos de una empresa sin presumir su uso en el tratamiento de un caso de uso futuro. Sólo en función de un uso específico seleccionaremos esos datos en bruto y los transformaremos en información estratégica.

Pasamos de una lógica "a priori" a una lógica "a posteriori. Esta revolución de un lago de datos se centra en nuevas habilidades y conocimientos: los científicos de datos y los ingenieros de datos son capaces de poner en marcha el tratamiento de datos, produciendo resultados mucho más rápido que el tiempo empleado utilizando almacenes de datos.

Otra ventaja de esta tierra prometida es su precio. Ofrecidos a menudo en código abierto, los lagos de datos son baratos, incluido el hardware que los acompaña. A menudo hablamos de hardware comunitario.

...o más bien, un pantano de datos

La revolución de los lagos de datos presenta ciertas ventajas, pero también nuevos retos. Los conocimientos necesarios para crear y mantener estos lagos de datos son escasos y, por tanto, costosos para las empresas. Además, verter datos en un lago de datos día tras día sin una gestión u organización eficaces conlleva el grave riesgo de inutilizar la infraestructura. Los datos se pierden inevitablemente en la masa.

Esta gestión de datos va acompañada de nuevas cuestiones relacionadas con la regulación de los datos (GDPR, Cnil, etc.) y la seguridad de los datos: temas ya existentes en el mundo de los almacenes de datos. Encontrar los datos adecuados para el uso adecuado todavía no es cosa fácil.

El acuerdo: Construir la gobernanza de los datos

Los gigantes de Internet han comprendido que centralizar estos datos es el primer paso, aunque insuficiente. El último ladrillo necesario para ir hacia un enfoque "data-driven" es construir una gobernanza de los datos. Innovar a través de los datos requiere un mayor conocimiento de los mismos. ¿Dónde se almacenan mis datos? ¿Quién los utiliza? ¿Con qué objetivo? ¿Cómo se utilizan?

Para ayudar a los profesionales de datos a trazar y visualizar el ciclo de vida de los datos, han aparecido nuevas herramientas: las llamamos "Catálogos de Datos". Situados por encima de las infraestructuras de datos, permiten crear un directorio de metadatos en el que se pueden realizar búsquedas. Permiten adquirir una visión de negocio y técnicas de datos centralizando toda la información recopilada. Del mismo modo que Google no almacena páginas web sino sus metadatos para referenciarlas, las empresas también deben almacenar los metadatos de sus datos para facilitar su explotación y descubrimiento. Gartner lo confirma en su estudio "Data Catalog is the New Black": si los datos de su lago de datos carecen de gestión y gobierno de metadatos, se considerará ineficiente.

Gracias a estas nuevas herramientas, los datos se convierten en un activo para todos los empleados. La interfaz fácil de usar no requiere conocimientos técnicos, convirtiéndose en una forma sencilla de conocer, organizar y gestionar estos datos. El catálogo de datos se convierte en la herramienta colaborativa de referencia en la empresa.

Adquirir una visión global de estos datos e iniciar la gobernanza de datos para para impulsar las ideas..

logo avatar actian

Acerca de Actian Corporation

Actian hace que los datos sean fáciles. Nuestra plataforma de datos simplifica el modo en que las personas conectan, gestionan y analizan los datos en entornos en la nube, híbridos y locales. Con décadas de experiencia en gestión de datos y análisis, Actian ofrece soluciones de alto rendimiento que permiten a las empresas tomar decisiones basadas en datos. Actian cuenta con el reconocimiento de los principales analistas y ha recibido premios del sector por su rendimiento e innovación. Nuestros equipos comparten casos de uso probados en conferencias (por ejemplo, Strata Data) y contribuyen a proyectos de código abierto. En el blog de Actian, cubrimos temas que van desde la ingestión de datos en tiempo real hasta el análisis impulsado por IA.