Curación de datos: Esencial para mejorar sus activos de datos
Corporación Actian
24 de agosto de 2021

No basta con tener grandes volúmenes de datos: lo que cuenta es lo que se hace con ellos. Para sacar el máximo partido de los datos, es necesario crear una verdadera cultura de datos en la empresa. La base de esta cultura es la curación de datos.
El 0% de los datos del mundo se han creado en los dos últimos años. Con el crecimiento exponencial de los dispositivos conectados, las empresas se enfrentarán a la desafortunada realidad de que nuestra capacidad para crear datos superará con creces nuestra capacidad para gestionarlos y explotarlos.
Y no va a ir a mejor. Según las estimaciones publicadas en Digital Economy Compass 2020 de Statista, el volumen anual de datos digitales creados en todo el mundo se ha multiplicado por más de 20 en la última década y superará la marca de los 50 zettabytes en 2021.
En este contexto, no es de extrañar que la mayoría de las empresas sólo sean capaces actualmente de analizar el 12% de los datos de que disponen. Porque, detrás de la recopilación, el almacenamiento y la seguridad de los datos, está, sobre todo, el valor empresarial que puede derivarse de ellos.
Este es el reto que aborda el concepto de Curación de Datos: el paso esencial para explotar el potencial de los abundantes activos de datos de una organización.
Definición de conservación de datos
Según la definición del INIST (Institut de l'Information Scientifique et Technique), dependiente del CNRS,
"La conservación se refiere a todas las actividades y operaciones necesarias para la gestión activa de los datos digitales de investigación, a lo largo de su ciclo de vida. El objetivo es hacerlos accesibles, compartibles y reutilizables de forma sostenible. En el ciclo de vida de los datos pueden identificarse tres partes interesadas: los creadores, casi siempre investigadores, los "curadores" y los usuarios."
En otras palabras, la curación de datos es una tarea que consiste en identificar en un catálogo de datos aquellos que pueden ser valorizados y explotados y, por segunda vez, ponerlos a disposición de los usuarios susceptibles de extraer de ellos las mejores enseñanzas.
Para establecer una Curación de Datos eficiente y relevante, es necesario comenzar con un mapeo preciso de los datos disponibles. Esta cartografía inicial es la base de una gobernanza de datos pragmática y operativa.
Una vez establecidas las normas de gobernanza, es hacia el usuario de los datos hacia quien debe dirigirse toda la atención. Los datos son un mineral que sólo tiene valor si se valora adecuadamente. Esta valoración debe concebirse como una respuesta a las necesidades del usuario. Es este último quien está en el origen del proyecto de conservación de datos.
Un proceso iterativo y continuo para la explotación de datos, distinto de todas las tareas esenciales para la gobernanza de los datos (desde la gestión de la calidad a la protección de los datos, pasando por la gestión del ciclo de vida de los datos).
Curación de datos: Requisitos esenciales, beneficios innegables
La Curación de Datos es una perspectiva de desarrollo rápido y masivo de una cultura de datos dentro de una organización.
La creación de una estrategia de gestión y conservación de datos permite hacer balance de los datos producidos. A continuación, es posible seleccionar los datos más relevantes y enriquecerlos con los metadatos necesarios para su comprensión y reutilización, también por parte de los usuarios empresariales.
Así, todos los miembros de la empresa pueden basar sus elecciones, decisiones, estrategias y métodos en el uso sistemático de los datos, sin necesidad de tener conocimientos específicos.
El objetivo: Crear las condiciones para el uso sistemático de los datos como base de cualquier proyecto o planteamiento, y no limitar su uso a equipos de Data Science o expertos en datos.
Para desplegar eficazmente su estrategia de curación de datos, debe apoyarse, por tanto, en elementos esenciales para la correcta gestión de sus activos de datos. El corazón del reactor no se limita a los catálogos de datos.
Si son esenciales y se derivan directamente de su mapa de datos, la gobernanza de los metadatos desempeña un papel aún más crucial. Los metadatos facilitan a los usuarios la interacción con las carteras de datos en lenguaje natural.
Con la curación de datos, entre definitivamente en una dinámica basada en los datos.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.