Revoluciones de datos: Hacia una visión empresarial de los datos
Corporación Actian
19 de agosto de 2019

El uso de datos masivos por parte de los gigantes de Internet en la década de 2000 fue una llamada de atención para las empresas: Los macrodatos son una palanca de crecimiento y competitividad que fomenta la innovación. Hoy, las empresas se reorganizan en torno a sus datos para adoptar un enfoque "data-driven". Es una historia con varios giros que tiende a encontrar finalmente una solución.
Este artículo analiza las distintas revoluciones de datos empresariales emprendidas en los últimos años hasta la fecha en un intento de maximizar el valor empresarial de los datos.
Arquitecturas aisladas
En los años 80, los Sistemas de Información se desarrollaron enormemente. Se crearon aplicaciones empresariales, surgieron lenguajes de programación avanzados y aparecieron las bases de datos relacionales. Todas estas aplicaciones permanecían en las plataformas de sus propietarios, aisladas del resto del ecosistema informático.
Por estas razones históricas y tecnológicas, los datos internos de una empresa se distribuían en diversas tecnologías y en formatos heterogéneos. Además de los problemas organizativos, hablamos entonces de un efecto tribal. Cada departamento informático dispone de sus propias herramientas y gestiona implícitamente sus propios datos para sus propios usos. Asistimos a una especie de acaparamiento de datos en las organizaciones. Para respaldar estas sugerencias, recordamos con frecuencia la ley de Conway: "Toda arquitectura refleja la organización que la creó". Así, esta organización, denominada silos, hace muy complejas y onerosas referencias cruzadas de datos procedentes de dos sistemas diferentes.
La búsqueda de una visión centralizada y global de los datos de una empresa llevará a los Sistemas de Información a una nueva revolución.
El concepto de almacén de datos
A finales de los años 90, el Business Intelligence estaba en pleno apogeo. Con fines analíticos y con la intención de responder a todas las cuestiones estratégicas, apareció el concepto de almacén de datos.
Para ello, recuperaremos los datos de mainframes o bases de datos relacionales y los transferiremos a un ETL (Extract Transform Loader). Proyectados en un formato denominado pivote, los analistas y responsables de la toma de decisiones pueden acceder a los datos recogidos y formateados para responder a preguntas preestablecidas y a casos concretos de reflexión. A partir de la pregunta, se obtiene un modelo de datos.
Esta revolución siempre viene acompañada de algún problema. El uso de herramientas ETL tiene un cierto coste, por no hablar del hardware que lo acompaña. El tiempo transcurrido entre la formalización de la necesidad y la recepción del informe lleva mucho tiempo. Es una revolución costosa para una eficacia perfectible.
La nueva revolución de un lago de datos
La llegada de los lagos de datos invierte el razonamiento anterior. Un lago de datos permite a las organizaciones centralizar todos los almacenamientos de datos útiles, independientemente de su origen o formato, por un coste muy bajo. . Almacenamos los datos de una empresa sin presumir su uso en el tratamiento de un caso de uso futuro. Sólo en función de un uso específico seleccionaremos esos datos en bruto y los transformaremos en información estratégica.
Pasamos de una lógica "a priori" a una lógica "a posteriori. Esta revolución de un lago de datos se centra en nuevas habilidades y conocimientos: los científicos de datos y los ingenieros de datos son capaces de poner en marcha el tratamiento de datos, produciendo resultados mucho más rápido que el tiempo empleado utilizando almacenes de datos.
Otra ventaja de esta tierra prometida es su precio. Ofrecidos a menudo en código abierto, los lagos de datos son baratos, incluido el hardware que los acompaña. A menudo hablamos de hardware comunitario.
...o más bien, un pantano de datos
La revolución de los lagos de datos presenta ciertas ventajas, pero también nuevos retos. Los conocimientos necesarios para crear y mantener estos lagos de datos son escasos y, por tanto, costosos para las empresas. Además, verter datos en un lago de datos día tras día sin una gestión u organización eficaces conlleva el grave riesgo de inutilizar la infraestructura. Los datos se pierden inevitablemente en la masa.
Esta gestión de datos va acompañada de nuevas cuestiones relacionadas con la regulación de los datos (GDPR, Cnil, etc.) y la seguridad de los datos: temas ya existentes en el mundo de los almacenes de datos. Encontrar los datos adecuados para el uso adecuado todavía no es cosa fácil.
El acuerdo: Construir la gobernanza de los datos
Los gigantes de Internet han comprendido que centralizar estos datos es el primer paso, aunque insuficiente. El último ladrillo necesario para ir hacia un enfoque "data-driven" es construir una gobernanza de los datos. Innovar a través de los datos requiere un mayor conocimiento de los mismos. ¿Dónde se almacenan mis datos? ¿Quién los utiliza? ¿Con qué objetivo? ¿Cómo se utilizan?
Para ayudar a los profesionales de datos a trazar y visualizar el ciclo de vida de los datos, han aparecido nuevas herramientas: las llamamos "Catálogos de Datos". Situados por encima de las infraestructuras de datos, permiten crear un directorio de metadatos en el que se pueden realizar búsquedas. Permiten adquirir una visión de negocio y técnicas de datos centralizando toda la información recopilada. Del mismo modo que Google no almacena páginas web sino sus metadatos para referenciarlas, las empresas también deben almacenar los metadatos de sus datos para facilitar su explotación y descubrimiento. Gartner lo confirma en su estudio "Data Catalog is the New Black": si los datos de su lago de datos carecen de gestión y gobierno de metadatos, se considerará ineficiente.
Gracias a estas nuevas herramientas, los datos se convierten en un activo para todos los empleados. La interfaz fácil de usar no requiere conocimientos técnicos, convirtiéndose en una forma sencilla de conocer, organizar y gestionar estos datos. El catálogo de datos se convierte en la herramienta colaborativa de referencia en la empresa.
Adquirir una visión global de estos datos e iniciar la gobernanza de datos para para impulsar las ideas..
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.