Inteligencia de datos

Uso de la plataforma de inteligencia de datos Actian: guía de nivel intermedio

Uso de la plataforma de inteligencia de datos Actian: guía de nivel intermedio

Esta guía está dirigida a usuarios intermedios de la plataforma Actian Data Intelligence Platform. No está diseñada para principiantes ni para expertos en metadatos.  

Como usuario intermedio, ya comprende los conceptos básicos de la del gobierno de datos y los catálogos de datos, pero desea mejorar su nivel utilizando la plataforma Actian. En esta guía, repasaremos la arquitectura y los conceptos básicos, la implementación y la configuración, los flujos de trabajo diarios, los usos avanzados y las prácticas recomendadas. Podrá optimizar la plataforma para descubrir sus datos, confiar en su calidad y activar los activos de datos.  

Descripción general de la plataforma y conceptos básicos

En primer lugar, aclaremos qué es la Actian Data Intelligence Platform , en qué se diferencia de otras herramientas y cuáles son los conceptos clave con los que trabajarás. 

¿Qué es la Plataforma?

Actian Data Intelligence Platform es una solución nativa en la nube y a escala empresarial para la gestión de metadatos, la catalogación de datos, el linaje de datos, la gobernanza de datos y un mercado de datos. Está impulsada por un gráfico de conocimiento federado gráfico de conocimiento utiliza un servidor Model Context Protocol (MCP) para mapear las relaciones entre los activos de datos, simplificar el descubrimiento de datos y proporcionar contexto a los datos en función del estado de su negocio.  

¿En qué se diferencia de un catálogo de datos básico?

A diferencia de los catálogos de datos tradicionales, la plataforma Actian: 

  • Combina metadatos, calidad y observabilidad de los datos, gobernanza, contexto empresarial y descubrimiento en una sola solución.
  • Utiliza un grafo de conocimiento que vincula metadatos técnicos, como tablas y columnas, con el contexto empresarial, incluyendo términos del glosario e indicadores clave de rendimiento (KPI), y mapeando las relaciones entre los datos.
  • Admite un modelo de producto de datos, en el que los conjuntos de datos se publican en un entorno de mercado de datos, con contratos, políticas, solicitudes de acceso y otros detalles establecidos.
  • Se implementa en entornos híbridos o multinube y se puede ampliar a distintos dominios y equipos.

Terminología que hay que conocer

 Estos son los términos que encontrarás: 

  • Gestión de metadatos. Captura y gestión de metadatos técnicos y empresariales de su ecosistema de datos, incluyendo fuentes de datos, informes, paneles de control y herramientas de BI. 
  • Catálogo de datos y descubrimiento de datos. Permite a los usuarios de los equipos técnicos y comerciales buscar, explorar y comprender conjuntos de datos. 
  • gráfico de conocimiento capa semántica. Representación de las relaciones entre los activos de datos, los dominios, los términos empresariales y el linaje. Esto sustenta el descubrimiento y el contexto. 
  • Gobernanza de datos. Políticas, funciones, controles de acceso, contratos y mecanismos de cumplimiento que garantizan un uso fiable de los datos. 
  • Productos de datos y mercado. Activos de datos publicados y gestionados, con documentación, contratos y facilidad de búsqueda por parte de los usuarios empresariales. 
  • Linaje y observabilidad. Seguimiento del flujo de datos desde su ingesta hasta su consumo, pasando por las transformaciones, supervisando la calidad y la integridad de los datos a lo largo de todo el proceso.  

Mejores prácticas de implementación y configuración

Antes de empezar a utilizar la plataforma a diario, es necesario contar con una base sólida. A continuación se indican algunas consideraciones de nivel intermedio sobre la implementación y la configuración: 

4 pasos para la arquitectura y la planificación medioambiental

  1. Elija su implementación. Decida si utilizará la versión SaaS/en la nube o una implementación local/híbrida. La plataforma es compatible con entornos híbridos y multinube. 
  2. Traza un mapa de tu ecosistema de datos. Determine qué fuentes existen, como bases de datos, lagos de datos, herramientas de BI y aplicaciones SaaS. Además, decida cómo se definen los dominios, ya sea por unidad de negocio, región o capacidad, y quién es responsable de las tareas relacionadas con los datos. 
  3. Planifique la conectividad. Asegúrese de que la plataforma pueda conectarse a sus fuentes para la ingesta de metadatos, el escaneo y el linaje.  
  4. Definir modelos de acceso y seguridad. Estos incluyen roles de usuario, separación de funciones, gobernanza federada frente a centralizada y autonomía de dominio frente a alineación empresarial. 

7 pasos para la configuración y la incorporación

  1. Instalar/configurar la plataforma. Configúrela para entornos en la nube o locales, configure la autenticación (LDAP/AD/SAML) y defina los usuarios administradores iniciales. 
  2. Defina los dominios y la estructura. Establezca dominios de datos. Por ejemplo, estos pueden ser ventas, finanzas u operaciones, y luego cree particiones o subcatálogos de catálogos de dominios según sea necesario. Esto permite la propiedad descentralizada de los datos. 
  3. Conecta tus fuentes de metadatos. Configure los escáneres integrados o las integraciones API para incorporar metadatos desde sus bases de datos, almacenes de datos, herramientas de BI, archivos, lagos de datos y otras fuentes. La plataforma los catalogará automáticamente. 
  4. Defina el glosario y la taxonomía de la empresa. Involucre a los propietarios de negocios y dominios para definir términos clave, definiciones, métricas e indicadores clave de rendimiento (KPI) para su organización. Estos serán utilizados por el gráfico de conocimiento ayudarán al descubrimiento y la comprensión. 
  5. Documentar productos de datos y contratos. Comience a publicar conjuntos de datos de alto valor como productos de datos. Defina metadatos, políticas, controles de acceso y contratos. Esto ayuda a poner en práctica el descubrimiento de datos de autoservicio para sus equipos. 
  6. Habilite el linaje y la observabilidad de los datos. Verifique que la captura del linaje funciona e integre sus procesos de calidad y observabilidad de datos para que los usuarios puedan confiar en sus datos. 
  7. Incorporar usuarios y proporcionar formación. Formar a los administradores de datos, ingenieros y usuarios empresariales sobre cómo optimizar la plataforma. 

Flujos de trabajo diarios

Ahora pasamos a cómo usted y su equipo utilizarán la plataforma de manera operativa, integrándola en sus flujos de trabajo. 

Descubrimiento de datos

Para los usuarios empresariales y los analistas de datos, estas capacidades del proceso de descubrimiento de datos son fundamentales: 

  • Realice búsquedas utilizando lenguaje natural o palabras clave en conjuntos de datos, informes, paneles de control y definiciones de glosarios. gráfico de conocimiento proporciona contexto semántico.
  • Explora la información de toda tu organización, como si se tratara de un mercado de datos.
  • Evalúa la fiabilidad del conjunto de datos. Antes de utilizar los datos, comprueba su procedencia, los indicadores de calidad, la propiedad o el contexto del glosario empresarial. Esto genera confianza y reduce la necesidad de volver a trabajar.
  • Envíe solicitudes de acceso a conjuntos de datos a través del mercado de datos o de un mecanismo de autoservicio, lo que agiliza el consumo y preserva la gobernanza.

Administradores e ingenieros de datos

El lado del «productor» es donde usted, como usuario intermedio, dedicará tiempo a mantener y enriquecer los metadatos, garantizar la gobernanza y publicar productos de datos. Estas son algunas de las tareas que realizará:  

  • Utilice las herramientas de escaneo de la plataforma para importar metadatos automáticamente, garantizar un linaje de datos sólido y clasificar los datos.
  • Enriquezca los metadatos manualmente a su antojo. Añada términos comerciales, definiciones, etiquetas de dominio, clasificaciones de confidencialidad, propietarios y notas de uso.
  • Defina contratos de datos y acuerdos de nivel de servicio (SLA) para productos de datos. La plataforma admite enfoques basados en contratos.
  • Gestione los flujos de trabajo de gobernanza, incluidas las aprobaciones para la publicación, el acceso a conjuntos de datos y los cambios en los metadatos. Esto ayuda a habilitar y mantener registros de auditoría.
  • Supervise el linaje. Visualice el flujo de datos desde la fuente hasta el informe, comprenda las dependencias y el impacto de los cambios, e identifique posibles transformaciones o cuellos de botella que puedan suponer un riesgo.

Productos de datos

Una de las características más interesantes de la plataforma es la conversión de conjuntos de datos en productos de datos de primera clase que se publican en un mercado dentro de su organización. Aquí es donde se unen el mundo empresarial y el mundo técnico. 

  • Usted o sus equipos de datos identifican conjuntos de datos de gran valor, como un resumen mensual de ventas, la segmentación de clientes o los datos presupuestarios de los centros de costes, y los publican como productos de datos.
  • Para cada producto, defina:  
    • Metadatos. La descripción, el dominio, el propietario y el administrador. 
    • Políticas. Quién puede acceder al producto de datos, con qué frecuencia se actualiza y métricas de calidad. 
    • Documentación. El contexto empresarial, los usos típicos y las advertencias conocidas. 
  • Coloca el producto en el mercado donde los usuarios empresariales puedan encontrarlo fácilmente mediante búsquedas, navegación o recomendaciones.
  • Por el lado del consumo, los usuarios encuentran el producto, evalúan su fiabilidad, solicitan acceso y comienzan a utilizarlo.
  • Supervisa el uso del producto. Realiza un seguimiento del número de usuarios que han accedido a él, los activos derivados creados a partir de él, recibe comentarios y observa la evolución del producto.

Funciones avanzadas de la plataforma de inteligencia de datos Actian

Una vez que se sienta cómodo con los flujos de trabajo estándar, podrá aprovechar las funciones más avanzadas y que aportan mayor valor añadido de la plataforma. 

gráfico de conocimiento búsqueda semántica

gráfico de conocimiento de la plataforma gráfico de conocimiento conjuntos de datos, columnas, términos comerciales, propietarios, dominios, transformaciones e informes. Esto, junto con el servidor MCP, le proporciona un contexto semántico y un descubrimiento más rico.  

Por ejemplo, cuando un usuario empresarial busca «tasa de abandono de clientes», la plataforma no solo devuelve conjuntos de datos denominados «customer_churn», sino también términos relacionados como «desgaste» y «customer_retention». También muestra el linaje, el dominio y las definiciones del glosario empresarial. 

Como usuario intermedio, puede perfeccionar el gráfico vinculando términos del glosario a conjuntos de datos, etiquetando relaciones de dominio y creando relaciones semánticas. Puede utilizar el gráfico para realizar análisis de impacto y, si modifica un conjunto de datos o elimina una columna, la plataforma identificará todas las dependencias posteriores mediante el recorrido del gráfico. 

Integración de IA y casos IA agencial

La plataforma ofrece un servidor MCP, que permite proporcionar datos controlados y de alta calidad a los asistentes de IA basados en LLM.  

Esto significa que los usuarios empresariales o analistas pueden formular una pregunta en lenguaje natural a un asistente de IA, como por ejemplo: «¿Cuál fue nuestro ingreso neto en Europa el último trimestre?». El asistente utiliza el gráfico de conocimiento, el servidor MCP, los metadatos y los contratos de datos para generar respuestas o sentencias SQL que se ajustan a las políticas de gobernanza. 

Los usuarios intermedios deben supervisar el rendimiento y la precisión de estas interacciones de IA, medir la adopción por parte de los usuarios y garantizar los bucles de retroalimentación para mejorar la alineación de los metadatos. 

Observabilidad de datos

Uno de los avances significativos de la plataforma es la introducción de Actian Data Observability. Esta solución se integra con la plataforma de inteligencia de datos para proporcionar supervisión en tiempo real de la calidad y las anomalías de los datos. 

Como usuario intermedio, puede configurar métricas de calidad clave para productos de datos críticos, conectarlos a paneles de observabilidad y definir alertas y flujos de trabajo para cuando se superen los umbrales de calidad. Utilice esto para aplicar la gobernanza por diseño. Con este enfoque, los productos de datos del mercado de datos tienen umbrales de calidad y mecanismos de corrección integrados. 

Vincule las observaciones sobre la calidad a los metadatos. Si hay alguna anomalía en un conjunto de datos, asegúrese de que quede registrada en los metadatos o en la gestión de casos para que los usuarios comprendan los problemas anteriores. 

Mejores prácticas para usuarios intermedios

Estas prácticas recomendadas garantizan que la adopción de la plataforma le proporcione un valor sostenible a largo plazo: 

  • Comience con dominios y conjuntos de datos de alto valor. Evite intentar catalogarlo todo de una vez. Empiece por áreas específicas y vaya ampliando.
  • Comprenda que los metadatos no son algo que se «configura y se olvida». Programe revisiones periódicas de propietarios, administradores, definiciones y uso de conjuntos de datos, y retire los activos obsoletos.
  • Incorporar la gobernanza en el resultado, no como un proceso independiente. Publicar productos de datos con contratos, políticas y controles de acceso, y automatizar su aplicación siempre que sea posible.
  • Trate a los usuarios empresariales como ciudadanos de primera clase. Asegúrese de que la interfaz de usuario sea fácil de usar, que el glosario empresarial esté completo, que la búsqueda sea intuitiva y que los usuarios empresariales tengan el acceso que necesitan.
  • Supervisar el uso y las métricas. Realice un seguimiento de los productos más y menos utilizados, la satisfacción de los usuarios y la eficacia de las búsquedas. Utilice esta información para mejorar los metadatos y retirar los activos que no se utilizan.
  • Formar y comunicar. La cultura de los metadatos tiene tanto que ver con las personas como con la tecnología. Ofrezca formación, marketing interno, horarios de oficina para los administradores de datos y bucles de retroalimentación.
  • Garantizar la escalabilidad. A medida que añada dominios, fuentes y usuarios, asegúrese de que su arquitectura pueda escalarse sin cuellos de botella en el rendimiento.
  • Plan para el cambio. Cuando cambien las fuentes de datos subyacentes o los modelos de negocio, necesitará notificaciones y flujos de trabajo para actualizar los metadatos y el linaje, así como para comunicarse con los consumidores de datos.
  • Documentar los flujos de trabajo y las responsabilidades. Defina quién es responsable de qué, como el propietario del dominio, el administrador, el curador de metadatos y el propietario del conector técnico. Aclare las funciones y responsabilidades para que nada se pierda ni se pase por alto.
  • Implementar medidas de seguridad, cumplimiento normativo e identificación de información confidencial. Asegúrese de que los productos de datos clasifiquen la información de identificación personal (PII) y otros datos confidenciales, aplique el control de acceso y mantenga registros de auditoría. La plataforma lo permite. 

Implementar la plataforma de inteligencia de datos Actian.

Actian Data Intelligence Platform es una potente solución empresarial de metadatos, catálogo, gobernanza y mercado basada en un gráfico de conocimiento, diseñada para dar servicio tanto a usuarios técnicos como empresariales. Como usuario intermedio, no solo debe centrarse en poner en marcha la plataforma, sino también en integrarla en los procesos de su organización.

Estos procesos incluyen la definición de dominios y productos de datos, el enriquecimiento de metadatos y la habilitación de el descubrimiento de autoservicio. La plataforma también ofrece gobernanza por diseño, capacidades avanzadas como el linaje y la observabilidad de los datos, y datos preparados para la inteligencia artificial. Puede utilizar la plataforma para democratizar el acceso a los datos, establecer la confianza y activar la inteligencia artificial.

¿Listo para empezar? Solicite una demostración en vivo hoy mismo para ver cómo la plataforma de inteligencia de datos Actian transforma los flujos de trabajo y simplifica la gestión de datos.

PREGUNTAS FRECUENTES

Un mercado de datos empresarial es una plataforma gobernada que conecta a productores y consumidores de datos, permitiendo la publicación, el descubrimiento, la concesión de licencias y la entrega segura de productos de datos curados, con API y conectores para integrar datos en flujos de trabajo de análisis e IA.

Revise la puntuación de calidad del proveedor, solicite conjuntos de datos de muestra y verifique la documentación del esquema. Muchas plataformas ofrecen pruebas para evaluar la calidad.

Priorice la gobernanza y la aplicación automatizada de políticas, la calidad de los datos y la verificación del linaje, la búsqueda intuitiva, la concesión de licencias y la facturación flexibles, y las integraciones analíticas/AI sin fisuras, además de la escalabilidad nativa en la nube y la automatización del cumplimiento normativo.

Entre los retos más comunes se encuentran el equilibrio entre privacidad y acceso, la integración de sistemas heredados, la ampliación de la infraestructura, la adopción y la gestión de la complejidad de las licencias.

Los mercados públicos ofrecen anuncios abiertos a cualquier comprador cualificado, mientras que las bolsas privadas restringen el acceso a los participantes invitados y suelen ofrecer acuerdos personalizados.

Los contratos de datos incorporan definiciones de esquemas y umbrales de calidad que los procesos CI/CD validan en cada versión, garantizando el cumplimiento.

Conecte la API del mercado a su canalización, introduzca definiciones de esquemas en el control de versiones y configure pruebas automatizadas para la calidad de los datos.

Verificar el contrato de datos del proveedor para la documentación de consentimiento y el registro de auditoría. Revisar las certificaciones de conformidad y los acuerdos de tratamiento de datos.

Combinan la investigación de proveedores, la elaboración automatizada de perfiles y la detección de anomalías, el seguimiento del linaje, los acuerdos de nivel de servicio y la supervisión continua del cumplimiento con registros de auditoría detallados e integración en sistemas de seguridad y gobernanza.