Guía para la gestión de la calidad de los datos #3 - Principales características de las herramientas de gestión de la calidad de los datos
Resumen
- Las herramientas de control de calidad de datos ayudan a las organizaciones a detectar, supervisar y corregir problemas relacionados con la calidad de los datos en numerosos sistemas y tipos de datos.
- Entre sus principales funciones se incluyen la conectividad, la elaboración de perfiles, la medición, la visualización y la supervisión continua.
- Además, permiten realizar tareas de limpieza, estandarización, cotejo, fusión y validación de direcciones para mejorar la coherencia y la precisión de los datos.
- Estas potentes herramientas permiten crear reglas de negocio, resolver problemas y gestionar metadatos en el marco de los procesos de calidad de los datos.
- La facilidad de uso es importante, sobre todo para que los usuarios sin conocimientos técnicos puedan participar en el mantenimiento y la mejora de la calidad de los datos.
La calidad de los datos se refiere a la capacidad de una organización para mantener la calidad de sus datos a lo largo del tiempo. Si tomáramos la palabra a algunos profesionales de los datos, mejorar la Calidad de los Datos es la panacea para todos nuestros males empresariales y, por tanto, debería ser la máxima prioridad.
Creemos que hay que matizar esto: la calidad de los datos es un medio, entre otros, para reducir las incertidumbres a la hora de alcanzar los objetivos corporativos.
En esta serie de artículos, repasaremos todo lo que los profesionales de los datos necesitan saber sobre la gestión de la calidad de los datos (DQM):
- Las nueve dimensiones de la calidad de los datos
- Retos y riesgos asociados a la calidad de los datos
- Principales características de las herramientas de gestión de la calidad de los datos
- Contribución del Catálogo de Datos a DQM
Una forma de comprender mejor los retos de la calidad de datos es examinar las soluciones de calidad de datos existentes en el mercado.
Desde un punto de vista operativo, ¿cómo identificamos y corregimos los problemas de Calidad de Datos? ¿Qué funciones ofrecen las herramientas de gestión de la calidad de los datos para mejorarla?
Sin entrar en demasiados detalles, vamos a ilustrar las ventajas de una herramienta de gestión de calidad de datos a través de los principales criterios de evaluación del Cuadrante Mágico de Gartner para soluciones de calidad de datos.
Conectividad
Una herramienta de gestión de la calidad de los datos debe ser capaz de recopilar y aplicar normas de calidad a todos los datos de la empresa (internos, externos, locales, en la nube, relacionales, no relacionales, etc.). La herramienta debe poder conectarse a todos los datos pertinentes para aplicar reglas de calidad.
Perfiles de datos, medición de datos y visualización de datos
No se pueden corregir los problemas de calidad de los datos si antes no se detectan. El perfilado de datos permite a los usuarios de TI y de negocio evaluar la calidad de los datos para identificar y comprender los problemas de Calidad de Datos.
La herramienta debe ser capaz de llevar a cabo lo que se describe en Las Nueve Dimensiones de la Calidad de los Datos para identificar los problemas de calidad en todas las dimensiones clave para la organización.
Supervisión
La herramienta debe poder seguir la evolución de la calidad de los datos y avisar a la dirección en un momento dado.
Normalización y limpieza de datos
A continuación viene la fase de limpieza de datos. El objetivo aquí es proporcionar funcionalidades de limpieza de datos con el fin de promulgar normas o reglas de negocio para alterar los datos (formato, valores, diseño de página).
Comparación y fusión de datos
El objetivo es identificar y eliminar los duplicados que puedan existir dentro de los conjuntos de datos o entre ellos.
Validación de direcciones
El objetivo es normalizar las direcciones que puedan estar incompletas o ser incorrectas.
Curación y enriquecimiento de datos
Las capacidades de una herramienta de gestión de la calidad de los datos son las que permiten integrar datos procedentes de fuentes externas y mejorar su exhaustividad, añadiendo así valor a los datos.
Desarrollo e implantación de normas empresariales
Las capacidades de una herramienta de gestión de la calidad de los datos son las que permiten crear, desplegar y gestionar las reglas de negocio, que luego pueden utilizarse para validar los datos.
Resolución de problemas
La herramienta de gestión de la calidad ayuda tanto a los usuarios de TI como a los de la empresa a asignar, escalar, resolver y supervisar los problemas de Calidad de Datos.
Gestión de metadatos
La herramienta también debe ser capaz de capturar y conciliar todos los metadatos relacionados con el proceso de Calidad de Datos.
Facilidad de uso
Por último, una solución debe ser capaz de adaptarse a los diferentes roles dentro de la empresa, y en concreto a los usuarios empresariales no técnicos.
Obtenga el eBook