Wiki de datos

Wiki de datos de Actian

Términos de uso común en el mundo de los datos, todos en un mismo lugar.

Metadatos activos son metadatos que se generan, actualizan y hacen accesibles automáticamente en todo el ecosistema de datos.

IA agencial - Sistemas autónomos de IA que realizan tareas y toman decisiones de forma proactiva con una intervención humana mínima.

Gobernanza de la IA es el marco y las políticas para garantizar un uso responsable, ético y conforme de los sistemas de IA.

Asistido por IA se refiere a tareas, decisiones o procesos mejorados o apoyados por la Inteligencia Artificial, en los que los humanos mantienen el control y toman las decisiones finales.

A glosario empresarial es un conjunto de definiciones estándar de términos empresariales para facilitar la comprensión entre los equipos.

Cumplimiento y privacidad garantizar el cumplimiento de normativas como GDPR, CCPA e HIPAA.

A catálogo de datos es un inventario estructurado de activos de datos para mejorar su descubrimiento y comprensión.

A contrato de datos es un acuerdo formal entre productores y consumidores de datos en el que se definen las expectativas, los formatos y los acuerdos de nivel de servicio para garantizar la calidad y la coherencia de los datos.

La democratización de los datos significa hacer que los datos sean accesibles y comprensibles para los usuarios no técnicos.

Tejido de datos es una arquitectura de datos centralizada para transportar, almacenar, acceder y gestionar datos en distintos entornos.

La gobernanza de datos es un conjunto de políticas, procesos y funciones que garantizan la calidad, seguridad y disponibilidad de los datos de una organización, promoviendo su uso y gestión adecuados durante todo su ciclo de vida.

El linaje de los datos se refiere al rastreo del origen, movimiento y transformación de los datos a través de los sistemas.

La alfabetización informática es la capacidad de las partes interesadas para leer, comprender y comunicarse utilizando datos.

La gestión de datos es el proceso de recopilación, almacenamiento, organización y mantenimiento de datos analíticos de forma que se garantice su accesibilidad, fiabilidad y seguridad.

A malla de datos es una arquitectura de datos descentralizada centrada en la propiedad de dominios.

Monetización de datos es convertir los activos de datos en valor financiero por medios directos o indirectos.

Observabilidad de los datos es la supervisión de la salud y fiabilidad de los conductos y sistemas de datos.

Propiedad de los datos se refiere a la persona responsable de la gestión global y la gobernanza de un conjunto de datos específico.

A producto de datos es un conjunto de datos comisariados, gobernados y reutilizables, creados teniendo en cuenta las necesidades del usuario y tratados como un producto con una propiedad y una gestión del ciclo de vida claras.

Perfilado de datos consiste en analizar los datos para comprender su estructura, contenido y calidad.

La calidad de los datos mide la exactitud, integridad y fiabilidad de los datos.

Disponibilidad de datos es el estado de los datos lo suficientemente limpios, completos y ricos en contexto para su uso en análisis o IA.

Residencia de los datos garantiza que los datos permanezcan dentro de unos límites geográficos o normativos específicos.

Clasificación de la sensibilidad de los datos consiste en etiquetar los datos por nivel de PII (Personally Identifiable Information) y riesgo.

Compartir datos es la puesta en común de datos dentro y fuera de las empresas, con casos de uso analítico en mente.

La soberanía de los datos es un concepto según el cual los datos están sujetos a las leyes y normativas del país donde se recogen.

La gestión de datos es la práctica de supervisar los activos de datos de una organización para garantizar que sean accesibles, fiables y seguros.

Estrategia de datos es el plan global para gestionar, utilizar y obtener valor de los activos de datos.

La confianza en los datos es la confianza en la exactitud, el linaje y la gobernanza de los datos.

Virtualización de datos consiste en abstraer el acceso a los datos sin replicar físicamente las fuentes de datos.

DataOps consiste en aplicar los principios de DevOps a las canalizaciones de datos para mejorar la agilidad y la calidad.

Mercado de datos empresariales (EDM) es una plataforma para compartir e intercambiar productos de datos dentro de una organización.

El gobierno federado de datos es un modelo de gobierno descentralizado en el que los dominios individuales gestionan sus datos con normas y políticas compartidas para garantizar la coherencia, el cumplimiento y la responsabilidad en toda la organización.

Un gráfico de conocimiento federado es un grafo en el que partes del grafo se aíslan a dominios específicos, para expresar el dominio de forma única, sin forzar a otros dominios a seguir la misma estructura de ontología/grafos.

A metamodelo flexible es un metamodelo que se alimenta de un gráfico de conocimiento.

Gobernanza por diseño consiste en integrar controles y políticas de gobernanza directamente en los contratos de datos.

A gráfico de conocimiento es una base de datos semiestructurada completamente flexible en cuanto a su organización y búsqueda, y que puede visualizarse como una red.

A LLM (Large Language Model) es un modelo de IA entrenado en grandes cantidades de texto para comprender y generar un lenguaje similar al humano.

Una Gestión de Datos Maestros (MDM) consiste en crear una única fuente de verdad para las entidades empresariales clave.

La gestión de metadatos es el proceso de organizar, controlar y utilizar metadatos (datos sobre datos) para mejorar la accesibilidad, calidad y facilidad de uso de los datos y, en última instancia, permitir la gobernanza de los datos de cerveza y la toma de decisiones empresariales.

A metamodelo es un "modelo de un modelo": define la estructura, las reglas y las relaciones para construir otros modelos dentro de un dominio determinado.

Ontología designa los conceptos relacionados dentro de un dominio. Una ontología va más allá de una taxonomía al describir cómo se relacionan e interactúan los conceptos.

La IIP (información de identificación personal) son datos sensibles que requieren un tratamiento y una protección especiales.

Aplicación de políticas consiste en aplicar automáticamente normas y controles de uso de datos.

RAG (Generación Mejorada por Recuperación) es una técnica de IA que mejora la precisión y pertinencia de los resultados de los LLM (Large Language Model) al permitirles acceder e incorporar información de fuentes de conocimiento externas, en lugar de basarse únicamente en sus datos preentrenados.

A capa semántica es una abstracción empresarial de fuentes de datos complejas para facilitar su comprensión.

Datos sintéticos son datos generados artificialmente que se utilizan para realizar pruebas o análisis que preservan la privacidad.

Taxonomía es una clasificación jerárquica de datos en categorías y subcategorías.