métadonnées

Formas y gráficos de datos SaaS sobre la imagen de una mujer en la tecnología

¿Qué son los metadatos?

métadonnées proporciona información sobre los datos.

¿Por qué son importantes métadonnées ?

Proporciona información que ayuda a los consumidores a encontrar, utilizar y comprender la calidad de los datos y su procedencia. métadonnées también demuestra cómo se relacionan los datos para proporcionar contexto a los usuarios.

Tipos de métadonnées

Puede clasificarse en las siguientes categorías:

  • métadonnées descriptivos incluyen información como el autor, la fecha de creación, la fecha de modificación y el tamaño.
  • métadonnées structurellesdescriben cómo se estructuran los datos compuestos. Por ejemplo, una sola cadena puede contener varios campos, incluida la información de longitud de campo variable y el tipo de datos.
  • métadonnées administrativas proporciona información de gestión, como la frecuencia con la que debe actualizarse para seguir siendo útil.
  • métadonnées référence registre l'information sur la qualité des données et la source.
  • métadonnées legales registra el titular de los derechos de autor, las limitaciones de uso y los requisitos de licencia.

Cómo se utiliza

métadonnées cumple múltiples funciones. La catalogación de los datos es importante, ya que informa a los usuarios de su calidad, integridad, procedencia y autoría. Las imágenes pueden tener métadonnées asociadas, incluidas firmas digitales, fechas de creación, ubicaciones geográficas, tamaño y profundidad de color. Los datos EXIF (Exchangeable Image File) son métadonnées Embarqué basadas en estándares dentro del archivo de imagen.

El Data Lakehouse proporciona métadonnées que aumentan significativamente el valor de los conjuntos de datos que mantiene mediante la documentación de la calidad de los datos y las relaciones entre los diferentes activos de datos.

Los sistemas de gestión de bases de datos lo mantienen en catálogos de sistemas que registran el número de registros de una tabla, la cardinalidad de los campos de datos, las marcas de agua alta y de agua baja, la selectividad de los índices y la agrupación de datos en índices.

Las aplicaciones web modernas utilizan interfaces de programación de aplicaciones (API) para acceder a herramientas de terceros y pasar datos utilizando tipos de datos métadonnées como JSON y XML. Las aplicaciones tradicionales pasaban datos entre ellas, pero no eran autodescriptivos, y no se podía interrogarlas para saber qué datos esperaban como se puede hacer con un servicio web moderno. A medida que las aplicaciones se vayan componentizando para ser utilizadas más fácilmente en la creación de nuevas aplicaciones, su número aumentará, lo que incrementará su necesidad de autodocumentar sus funciones y sus necesidades de datos.

Beneficios de métadonnées

La necesidad de métadonnées está creciendo principalmente debido a los siguientes beneficios:

  • Aumenta la utilidad de las fuentes de datos existentes.
  • Hace que los datos sean útiles documentando su calidad y utilidad.
  • Incluye etiquetas que permiten encontrar los datos mediante motores de búsqueda.
  • Promueve gouvernance los datos documentando a los propietarios de los datos o su ausencia.
  • A medida que crecen los volúmenes y las fuentes de datos, éstos adquieren un valor cada vez mayor.
  • La partage des données est une bonne pratique de gestion des données qui bénéficie du propriétaire des données et des partenaires commerciaux qui partagent les données. Le succès de la partage des données dépend des bonnes métadonnées. Les données qui ne sont pas bien documentées sont susceptibles de ne pas être utilisées ou d'être confianceuses.
  • Es un pilar fundamental de los modelos de datos avanzados, como los almacenes de datos, los lagos de datos y las mallas de datos.
  • Apoya el proceso de descubrimiento de registros para las auditorías de cumplimiento.
  • La visibilidad que se obtiene al utilizarlo para documentar los activos de datos de una organización es el primer paso para racionalizar el uso de los datos, de modo que los datos duplicados puedan revisarse, fusionarse o eliminarse.

Actian

Actian Data Platform facilita la creación de almacenes de datos de haute performance . La base de datos columnar y vectorizada integrada utiliza una capacidad de consulta paralela superior para obtener resultados de consulta más rápidos. Los datos externos pueden registrarse en el almacén de datos para acceder a ellos con la misma facilidad que a un objeto interno. Los conectores de datos incluyen Hadoop Spark. Se puede acceder a varias instancias de bases de datos distribuidas mediante una única consulta SQL para admitir modelos de datos federados.

La integración de datos como servicio incorporada conecta con cientos de fuentes de datos y puede utilizarse para documentar, extraer y cargar datos basados en archivos y en flujo. Actian le permite conectarse a API REST y SOAP para crear y gestionar integraciones.

Actian Data Platform funciona con estructuras de almacenamiento de datos populares que incluyen cubos S3, carpetas de Google Drive y almacenamiento Azure Blob. Las instancias pueden desplegarse en varias plataformas en la nube mediante una interfaz de usuario y una consola de gestión estándar.