Análisis de datos

¿Tiene datos grandes, rápidos, inútiles o feos? Esto es lo que hay que hacer.

Teresa Wingfield

5 de enero de 2023

Hombre con una tableta en las manos en la que aparecen datos ilustrados digitalmente como ejemplo de datos no estructurados

Hace más de 20 años que Meta Group (adquirida por Gartner) introdujo las 3V de los datos: Volumen, Velocidad y Variedad. Más tarde, Gartner amplió las 3V a 5V añadiendo Valor y Veracidad. A día de hoy, siguen siendo consideraciones importantes en el análisis de datos. Sin embargo, su tamaño y complejidad siguen aumentando. Veamos en qué punto nos encontramos hoy y algunos consejos para seguir el ritmo.

Infografía ilustrada sobre las 5 V de los datos

Volumen

El volumen de datos se refiere al tamaño de los datos que hay que analizar y procesar. Los datos son cada vez más grandes. IDC predice que el volume de données global volume de données aumentará hasta 175 zettabytes en 2025. Más de la mitad de esta cifra, 90 zettabytes, procederá de dispositivos del Internet de las Cosas (IoT). Además, Forbes predice que 150 billones de gigabytes de datos en tiempo real necesitarán análisis para 2025.

Punteros:

  • Busque soluciones que puedan adaptarse a los volúmenes de datos.
  • Asegúrese de que puede reutilizar las canalizaciones de datos y compartir datos entre casos de uso.
  • Elija análisis en tiempo real que puedan cumplir sus indicadores clave de rendimiento y sus acuerdos de nivel de servicio.
  • Evalúe la capacidad de la solución para ofrecer una gestión, gouvernance y cumplimiento coherentes.

Velocidad

La velocidad se refiere a la rapidez con la que se generan los datos. Los datos son cada vez más rápidos, especialmente con el aumento del análisis de flujos de datos en tiempo real para abordar diversos casos de uso, como el análisis de datos de sensores IoT, la détection des fraudes, la publicidad en línea, la ciberseguridad, el analyse des logs, el comercio de acciones y mucho más. IDC estima que los datos generados por los dispositivos IoT conectados ascenderán a 79,4 zettabytes en 2025, frente a los 13,6 ZB de 2019.

Punteros:

  • Preprocesamiento de datos en el perímetro para reducir el coste y el esfuerzo de mover y almacenar datos.
  • Pruebe las capacidades de carga de datos a alta velocidad de su analítica de datos para poder acceder rápidamente a los datos operativos y de flujo continuo.

Variedad

La variedad se refiere al número de tipos de datos e incluye datos estructurados, semiestructurados o no estructurados. Los datos necesarios para el análisis están cada vez más mezclados. Los datos no estructurados, contenidos que no se ajustan a un modelo de datos específico y predefinido, están aumentando rápidamente. IDC prevé que el 80% de los datos mundiales serán no estructurados en 2025. Alrededor del 90% de los datos no estructurados se han creado en los últimos dos años. Hoy en día, las organizaciones analizan sólo el 0,5% de los datos no estructurados, pero sin duda esta cifra aumentará pronto. Los datos semiestructurados, como los formatos JSON, XML y HTML, también están creciendo de forma espectacular debido al crecimiento de la web.

Punteros:

  • Evalúe la capacidad de la solución para hacer accesibles los datos independientemente de su estructura o formato.
  • Busque flexibilidad para crear conectores personalizados y ampliar las integraciones.

Valor

El valor se refiere a si los datos repercuten positivamente en los resultados empresariales de una empresa. Por desgracia, a menudo los datos son inútiles. La razón es sencilla: los datos no satisfacen las necesidades de los usuarios. Según Forrester, menos del 0,5% de todos los datos se analizan y utilizan. También estima que si la empresa típica de Fortune 1000 pudiera aumentar la accesibilidad de los datos en un 10%, generaría más de 65 millones de dólares en ingresos netos adicionales.

Punteros:

  • Conozca qué datos necesitan realmente sus usuarios.
  • Dé prioridad a los datos que ayudarán a los usuarios a alcanzar sus objetivos.
  • Comprender los problemas que pueden impedir que los usuarios obtengan la información que necesitan.
  • Presente los datos en el momento oportuno y en el contexto adecuado.

Veracidad

La veracidad se refiere a la calidad y credibilidad de los datos. Los datos pueden ser feos y las decisiones que se toman sobre ellos cuestan dinero. Según Gartner, el impacto financiero que los datos de mala calidad tienen en una organización es de unos 15 millones de dólares en pérdidas al año de media.

Punteros:

  • Asegúrese de que la calidad de sus datos es adaptable y escalable.
  • Incluya un nivel de automatización que pueda ayudar a filtrar los datos de calidad e integrarlos mejor en toda la empresa.
  • Adopte un enfoque colaborativo de la calidad de los datos en toda la empresa para aumentar el intercambio de conocimientos y la transparencia sobre cómo se almacenan y utilizan los datos.

Recursos adicionales:

avatar del usuario teresa

Acerca de Teresa Wingfield

Teresa Wingfield es Directora de Marketing de Producto en Actian, impulsando el conocimiento de las capacidades de integración, gestión y análisis de Actian Data Platform. Cuenta con más de 20 años de experiencia en marketing de soluciones analíticas, de seguridad y en la nube en empresas líderes del sector como Cisco, McAfee y VMware. Teresa se centra en ayudar a los clientes a alcanzar nuevos niveles de innovación e ingresos con los datos. En el blog de Actian, Teresa destaca el valor de las soluciones basadas en análisis en múltiples sectores verticales. Consulte sus publicaciones para conocer historias reales de transformación.