Inteligencia de datos

Guía para la gestión de la calidad de datos nº 2 - Los retos de la calidad de datos

Corporación Actian

2 de abril de 2022

Las 9 dimensiones de la calidad de los datos

La calidad de los datos se refiere a la capacidad de una organización para mantener la calidad de sus datos a lo largo del tiempo. Si tomáramos la palabra a algunos profesionales de los datos, mejorar la Calidad de los Datos es la panacea para todos nuestros males empresariales y, por tanto, debería ser la máxima prioridad. 

Creemos que esto debe matizarse: La calidad de los datos es un medio, entre otros, de limitar las incertidumbres en el cumplimiento de los objetivos de las empresas. 

En esta serie de artículos, repasaremos todo lo que los profesionales de los datos necesitan saber sobre la gestión de la calidad de los datos (DQM):

  1. Las nueve dimensiones de la calidad de los datos
  2. Retos y riesgos asociados a la calidad de los datos
  3. Principales características de las herramientas de gestión de la calidad de los datos
  4. Contribución del Catálogo de Datos a DQM

Los retos de la calidad de los datos para las organizaciones

Las organizaciones suelen poner en marcha iniciativas para mejorar la calidad de los datos con el fin de cumplir los requisitos de conformidad y reducir los riesgos. Son indispensables para tomar decisiones fiables. Desgraciadamente, hay muchos escollos que pueden obstaculizar las iniciativas de mejora de la calidad de los datos. A continuación se ofrecen algunos ejemplos:

  • El crecimiento exponencial del volumen, la velocidad y la variedad de los datos hace que el entorno sea más complejo e incierto.
  • Presión creciente de normativas de conformidad como GDPR, BCBS 239 o HIPAA.
  • Los equipos están cada vez más descentralizados y cada uno tiene su especialidad.
  • Los equipos de TI y de datos están saturados y no tienen tiempo para resolver los problemas de calidad de datos.
  • Los procesos de agregación de datos son complejos y largos.
  • Puede resultar difícil normalizar los datos entre distintas fuentes.
  • Las auditorías de cambios entre sistemas son complejas.
  • Las políticas de gobernanza son difíciles de aplicar.

Dicho esto, también hay numerosas oportunidades que aprovechar. Los datos de alta calidad permiten a las organizaciones facilitar la innovación con inteligencia artificial y garantizar una experiencia del cliente más personalizada. Suponiendo que haya suficientes datos de calidad. 

De hecho, Gartner ha pronosticado que hasta 2022, el 85% de los proyectos de IA producirán datos erróneos como resultado de sesgos en los datos, algoritmos o de los equipos encargados de la gestión de datos.

Reducir el nivel de riesgo mejorando la calidad de los datos

La mala calidad de los datos debe considerarse un riesgo y el software de mejora de la calidad una posible solución para reducir este nivel de riesgo.

Tratamiento de un problema de calidad

Si aceptamos la noción anterior, cualquier problema de calidad debe abordarse en varias fases:

1. Identificación de riesgos: Esta fase consiste en buscar, reconocer y describir los riesgos que pueden ayudar/impedir a la organización alcanzar sus objetivos, en parte debido a la falta de Calidad de los Datos.

2. Análisis de riesgos: El objetivo de esta fase es comprender la naturaleza del riesgo y sus características. Incluye los factores de similitud de los sucesos y sus consecuencias, la naturaleza y la importancia de estas consecuencias, etc. Aquí debemos tratar de identificar la causa de la mala calidad de los datos de marketing. Podríamos citar, por ejemplo:

  • Una mala experiencia de usuario del sistema de origen que provoca errores de escritura;
  • Falta de verificación de la integridad, exactitud, validez, unicidad, coherencia o actualidad de los datos;
  • Falta de medios sencillos para garantizar la trazabilidad, claridad y disponibilidad de los datos;
  • La ausencia de un proceso de gobernanza y sus implicaciones para los equipos empresariales.

3. Evaluación de riesgos: El objetivo de esta fase es comparar los resultados del análisis de riesgos con los criterios de riesgo establecidos. Ayuda a determinar si es necesario adoptar nuevas medidas para la toma de decisiones (por ejemplo, mantener los medios actuales, emprender nuevos análisis, etc.).

Centrémonos en las nueve dimensiones de la calidad de los datos y evaluemos el impacto de la mala calidad en cada una de ellas:

Los valores de los niveles de probabilidad y gravedad deben ser definidos por los principales interesados, que son quienes mejor conocen los datos en cuestión. 

4. Tratamiento del riesgo: Esta fase de tratamiento tiene por objeto establecer las opciones disponibles para reducir el riesgo e implantarlas. Este tratamiento también implica la capacidad de evaluar la utilidad de las medidas adoptadas, determinar si el riesgo residual es aceptable o no y, en este último caso, considerar la posibilidad de un tratamiento posterior.

Por tanto, está claro que mejorar la calidad de los datos no es un objetivo en sí mismo:

  • Su coste debe evaluarse en función de los objetivos de la empresa.
  • Los tratamientos que se apliquen deben evaluarse a través de cada dimensión de la calidad.

Obtenga nuestra Guía de gestión de calidad de datos para organizaciones basadas en datos

Si desea más información sobre calidad de datos y DQM, descargue ahora nuestra guía gratuita: "Guía para la gestión de la calidad de datos". Descargue el eBook

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.