¿Qué es el linaje de datos?
Corporación Actian
13 de septiembre de 2021

Para poder acceder y explotar sus activos de datos de forma regular, su organización necesitará saberlo todo sobre sus datos. Esto incluye sus orígenes, sus transformaciones a lo largo del tiempo y su ciclo de vida global. Todo este conocimiento puede obtenerse de Data Lineage.
En este artículo, definiremos Data Lineage, ofreceremos una analogía y explicaremos sus principales ventajas para las organizaciones basadas en datos.
Después de los recursos humanos, los datos se han convertido en el activo más valioso para las empresas hoy en día.
Es la base que une a empresas, clientes y socios. Sabiendo esto, los datos deben preservarse y aprovecharse, ya que contienen toda la inteligencia de una organización.
Sin embargo, una gran información conlleva una gran responsabilidad para quienes gestionan o utilizan estos datos. Por un lado, deben identificar los datos que revelan perspectivas estratégicas para la empresa y, por otro, deben adoptar las medidas de seguridad adecuadas para evitar consecuencias financieras y de reputación devastadoras.
Con la llegada de leyes de cumplimiento de datos como la BCBS-239 o el GDPR, el responsable (normalmente el DPO) del cumplimiento de los datos debe establecer condiciones transparentes para garantizar que no se explotará ningún dato en detrimento de un cliente.
Aquí es donde interviene el linaje de datos. Detrás de la palabra linaje se esconde un concepto esencial: la trazabilidad de los datos. Esta trazabilidad abarca todo el ciclo de vida de los datos, desde su recogida hasta su utilización, almacenamiento y conservación a lo largo del tiempo.
Cómo funciona el linaje de datos
Como ya se ha mencionado, el objetivo del linaje de datos es garantizar la trazabilidad absoluta de sus activos de datos. Esta trazabilidad no se limita a conocer el origen de la información. Va mucho más allá.
Para entender la naturaleza de la información sobre linajes, utilicemos una pequeña analogía:
Imagine que está cenando en un restaurante gastronómico. El menú incluye platos con nombres poéticos, compuestos de muchos ingredientes más o menos exóticos, algunos de los cuales le resultan extraños. Cuando el camarero le trae su plato, lo saborea, lo aprecia y se pregunta por el origen de lo que está comiendo.
Dependiendo de su punto de vista, no esperará la misma respuesta.
Como aficionado a la buena cocina, querrá saber cómo se han transformado y ensamblado los distintos ingredientes para obtener el producto final. Querrá conocer los diferentes pasos de la preparación, la técnica de cocción, la duración, los condimentos utilizados, la sazón, etc. En definitiva, le interesan los aspectos más técnicos de la preparación final: la receta.
Como controlador, se centrará más en la cadena completa de suministro y transformación: quiénes son los proveedores, lugares y condiciones de cría o cultivo de las materias primas, transporte, envasado, corte y preparación, etc. También querrá asegurarse de que esta cadena de suministro cumple las distintas etiquetas o denominaciones que el restaurador destaca (origen de los ingredientes, ecológico, "casero", AOC, AOP, etc.).
Otros pueden centrarse en las dimensiones histórica y cultural: ¿de qué región o tradición procede o se inspira el plato? ¿Cuándo y quién lo creó originalmente? Otros (ciertamente más raros) se preguntarán por el origen filogenético de la raza de ternera preparada por el chef...
En resumen, cuando se trata de gastronomía, la cuestión del origen no espera una respuesta única y homogénea. Y lo mismo ocurre con los datos.
De hecho, con Data Lineage, tendrá acceso a una herramienta de supervisión de datos en tiempo real.
Una vez recogidos, los datos se controlan constantemente para:
- Detecte y controle cualquier error en el tratamiento de sus datos.
- Gestionar y supervisar continuamente todos los cambios en los procesos minimizando los riesgos de degradación de los datos.
- Gestione las migraciones de datos.
- Tenga una visión de 360° sobre los metadatos.
El linaje de datos garantiza que sus datos proceden de una fuente fiable y controlada, que las transformaciones que han sufrido son conocidas, supervisadas y legítimas, y que están disponibles en el lugar adecuado, en el momento adecuado y para el usuario adecuado.
Actuando como herramienta de control, la principal misión de Data Lineage es validar la exactitud y coherencia de sus datos.
¿Cómo hacerlo? Permitiendo a sus empleados investigar todo el ciclo de vida de los datos, tanto en sentido ascendente como descendente, desde el origen de los datos hasta su destino final, con el fin de detectar y aislar cualquier anomalía y corregirla.
Principales ventajas del linaje de datos
La primera ventaja de Data Lineage tiene que ver con la conformidad. Ayuda a identificar y mapear todos los procesos de producción y explotación de datos y limita su exposición al riesgo de incumplimiento de los datos personales.
Data Lineage también facilita la gobernanza de los datos porque proporciona a su empresa y a sus empleados un repositorio completo que describe sus flujos de datos y metadatos. Este conocimiento es esencial para diseñar una arquitectura de datos 100% operativa.
Data Lineage facilita la automatización de la documentación de sus flujos de producción de datos. Por lo tanto, si está planeando aumentar la importancia de los datos en su estrategia de desarrollo, Data Lineage le permitirá ahorrar una cantidad considerable de tiempo en el despliegue de proyectos en los que los datos son clave.
Finalmente, la última gran ventaja de Data Lineage se refiere a sus empleados. Con datos cuyo origen, calidad y fiabilidad están garantizados por Data Lineage, pueden confiar plenamente en sus flujos de datos y basar sus acciones diarias en este activo indispensable.
Ahorre tiempo, garantice la conformidad de sus datos, haga más fluida la acción de sus equipos e inscriba a su empresa en una nueva dimensión, basada en una estrategia de datos sin compromisos. No espere más, empiece ya.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.