Inteligencia de datos

¿Qué es el linaje de datos?

Corporación Actian

13 de septiembre de 2021

blog de cobertura de linaje de datos

Para poder acceder y explotar sus activos de datos de forma regular, su organización necesitará saberlo todo sobre sus datos. Esto incluye sus orígenes, sus transformaciones a lo largo del tiempo y su ciclo de vida global. Todo este conocimiento puede obtenerse de Data Lineage.

En este artículo, definiremos Data Lineage, ofreceremos una analogía y explicaremos sus principales ventajas para las organizaciones basadas en datos. 

Después de los recursos humanos, los datos se han convertido en el activo más valioso para las empresas hoy en día. 

Es la base que une a empresas, clientes y socios. Sabiendo esto, los datos deben preservarse y aprovecharse, ya que contienen toda la inteligencia de una organización.

Sin embargo, una gran información conlleva una gran responsabilidad para quienes gestionan o utilizan estos datos. Por un lado, deben identificar los datos que revelan perspectivas estratégicas para la empresa y, por otro, deben adoptar las medidas de seguridad adecuadas para evitar consecuencias financieras y de reputación devastadoras. 

Con la llegada de leyes de cumplimiento de datos como la BCBS-239 o el GDPR, el responsable (normalmente el DPO) del cumplimiento de los datos debe establecer condiciones transparentes para garantizar que no se explotará ningún dato en detrimento de un cliente.

Aquí es donde interviene el linaje de datos. Detrás de la palabra linaje se esconde un concepto esencial: la trazabilidad de los datos. Esta trazabilidad abarca todo el ciclo de vida de los datos, desde su recogida hasta su utilización, almacenamiento y conservación a lo largo del tiempo.

Cómo funciona el linaje de datos

Como ya se ha mencionado, el objetivo del linaje de datos es garantizar la trazabilidad absoluta de sus activos de datos. Esta trazabilidad no se limita a conocer el origen de la información. Va mucho más allá.

Para entender la naturaleza de la información sobre linajes, utilicemos una pequeña analogía:

Imagine que está cenando en un restaurante gastronómico. El menú incluye platos con nombres poéticos, compuestos de muchos ingredientes más o menos exóticos, algunos de los cuales le resultan extraños. Cuando el camarero le trae su plato, lo saborea, lo aprecia y se pregunta por el origen de lo que está comiendo.

Dependiendo de su punto de vista, no esperará la misma respuesta.

Como aficionado a la buena cocina, querrá saber cómo se han transformado y ensamblado los distintos ingredientes para obtener el producto final. Querrá conocer los diferentes pasos de la preparación, la técnica de cocción, la duración, los condimentos utilizados, la sazón, etc. En definitiva, le interesan los aspectos más técnicos de la preparación final: la receta.

Como controlador, se centrará más en la cadena completa de suministro y transformación: quiénes son los proveedores, lugares y condiciones de cría o cultivo de las materias primas, transporte, envasado, corte y preparación, etc. También querrá asegurarse de que esta cadena de suministro cumple las distintas etiquetas o denominaciones que el restaurador destaca (origen de los ingredientes, ecológico, "casero", AOC, AOP, etc.).

Otros pueden centrarse en las dimensiones histórica y cultural: ¿de qué región o tradición procede o se inspira el plato? ¿Cuándo y quién lo creó originalmente? Otros (ciertamente más raros) se preguntarán por el origen filogenético de la raza de ternera preparada por el chef...

En resumen, cuando se trata de gastronomía, la cuestión del origen no espera una respuesta única y homogénea. Y lo mismo ocurre con los datos.

De hecho, con Data Lineage, tendrá acceso a una herramienta de supervisión de datos en tiempo real.

Una vez recogidos, los datos se controlan constantemente para:

  • Detecte y controle cualquier error en el tratamiento de sus datos.
  • Gestionar y supervisar continuamente todos los cambios en los procesos minimizando los riesgos de degradación de los datos.
  • Gestione las migraciones de datos.
  • Tenga una visión de 360° sobre los metadatos.

El linaje de datos garantiza que sus datos proceden de una fuente fiable y controlada, que las transformaciones que han sufrido son conocidas, supervisadas y legítimas, y que están disponibles en el lugar adecuado, en el momento adecuado y para el usuario adecuado.

Actuando como herramienta de control, la principal misión de Data Lineage es validar la exactitud y coherencia de sus datos.

¿Cómo hacerlo? Permitiendo a sus empleados investigar todo el ciclo de vida de los datos, tanto en sentido ascendente como descendente, desde el origen de los datos hasta su destino final, con el fin de detectar y aislar cualquier anomalía y corregirla.

Principales ventajas del linaje de datos

La primera ventaja de Data Lineage tiene que ver con la conformidad. Ayuda a identificar y mapear todos los procesos de producción y explotación de datos y limita su exposición al riesgo de incumplimiento de los datos personales.

Data Lineage también facilita la gobernanza de los datos porque proporciona a su empresa y a sus empleados un repositorio completo que describe sus flujos de datos y metadatos. Este conocimiento es esencial para diseñar una arquitectura de datos 100% operativa. 

Data Lineage facilita la automatización de la documentación de sus flujos de producción de datos. Por lo tanto, si está planeando aumentar la importancia de los datos en su estrategia de desarrollo, Data Lineage le permitirá ahorrar una cantidad considerable de tiempo en el despliegue de proyectos en los que los datos son clave. 

Finalmente, la última gran ventaja de Data Lineage se refiere a sus empleados. Con datos cuyo origen, calidad y fiabilidad están garantizados por Data Lineage, pueden confiar plenamente en sus flujos de datos y basar sus acciones diarias en este activo indispensable. 

Ahorre tiempo, garantice la conformidad de sus datos, haga más fluida la acción de sus equipos e inscriba a su empresa en una nueva dimensión, basada en una estrategia de datos sin compromisos. No espere más, empiece ya.

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.