Blog | Inteligencia de datos | | 2 min de lectura

¿Qué es la huella digital de datos y la detección de similitudes?

huella digital de datos

Con la aparición del Big Data, las empresas se encontraron con una cantidad colosal de datos. Para comprender y analizar sus datos, así como para cumplir los diversos requisitos normativos, es vital que las organizaciones documenten sus activos de datos. Sin embargo, documentar y dar contexto a miles de conjuntos de datos es una tarea muy difícil, incluso imposible, de hacer a mano.

O bien, puedes utilizar la identificación de datos.

¿Qué es la huella digital de datos?

En el ámbito de los datos, una huella digital representa una "firma", o huella, de una columna de datos. El objetivo aquí es dar contexto a estas columnas.

Gracias a esta tecnología, una huella digital de datos puede detectar automáticamente conjuntos de datos similares en tus bases de datos y documentarlos con mayor facilidad, lo que hace que las tareas de los administradores de datos sean menos tediosas y más eficientes. Por ejemplo, bajo la supervisión del administrador de datos, las tecnologías de huellas digitales de datos nos permiten comprender que una columna de datos con la información «Francia», «Estados Unidos» y «Australia» representa «Países».

Huella digital de datos

En elcaso de la plataforma Actian Data Intelligence, el objetivo de nuestra plataforma de gestión de metadatos es dotar de significado y contexto a sus conjuntos de datos catalogados de la forma más automática posible. Gracias a nuestras tecnologías de aprendizaje automático, la plataforma Actian Data Intelligence identifica las columnas del esquema de los conjuntos de datos, las analiza y les asigna una «firma» propia. De este modo, si alguna de estas huellas es similar, nuestro catálogo de datos sugerirá al administrador de datos si debe proporcionar la misma información en relación con otro conjunto de datos.

Esta tecnología también ofrece un medio para que los RPD, entre otros, subrayen y señalen la información personal o sensible que la organización posee en sus bases de datos.