¿Qué es un gráfico de conocimiento y cómo mejora los catálogos de datos?
Corporación Actian
4 de noviembre de 2020

Los gráficos de conocimiento llevan tiempo interactuando con nosotros. Ya sea a través de experiencias de compra personalizadas mediante recomendaciones en línea en sitios web como Amazon, Zalando, o a través de nuestro motor de búsqueda favorito Google.
Sin embargo, este concepto sigue siendo a menudo un reto para la mayoría de los gestores de datos y análisis, que luchan por agregar y vincular sus activos empresariales para sacarles partido como hacen estos gigantes de la web.
Para respaldar esta afirmación, Gartner afirma en su artículo "How to Build Knowledge Graphs That Enable AI-Driven Enterprise Applications" que:
"Los responsables de datos y análisis se están encontrando con un creciente revuelo en torno a los gráficos de conocimiento, pero luchan por encontrar casos de uso significativos que puedan garantizar la aceptación por parte de las empresas".
En este artículo, definiremos el concepto de grafo de conocimiento ilustrándolo con el ejemplo de Google y destacando cómo puede potenciar un catálogo de datos.
¿Qué es exactamente un gráfico de conocimiento?
Según GitHub, un grafo de conocimiento es un tipo de ontología que representa el conocimiento en términos de entidades y sus relaciones de una forma dinámica y basada en datos. Al contrario que las ontologías estáticas, que son muy difíciles de mantener.
He aquí otras definiciones de un grafo de conocimiento realizadas por diversos expertos:
- Un "medio de almacenar y utilizar datos, que permite a personas y máquinas aprovechar mejor las conexiones de sus conjuntos de datos". (Datanami)
- Una "base de datos que almacena información en formato gráfico y, lo que es más importante, puede utilizarse para generar una representación gráfica de las relaciones entre cualquiera de sus puntos de datos". (Forbes)
- "Enciclopedias del mundo semántico". (Forbes)
Mediante algoritmos de aprendizaje automático estructura todos sus datos y permite crear relaciones multilaterales entre sus fuentes de datos.. La fluidez de esta estructura crece más a medida que se introducen nuevos datos, lo que permite crear más relaciones y añadir más contexto, lo que ayuda a sus equipos de datos a tomar decisiones informadas con conexiones que quizá nunca hubieran encontrado.
La idea de un grafo de conocimiento es construir una red de objetos y, lo que es más importante, crear relaciones semánticas o funcionales entre los distintos activos.
Dentro de un catálogo de datos, un grafo de conocimiento es, por tanto, lo que representa los distintos conceptos y lo que vincula los objetos entre sí mediante enlaces semánticos o estáticos.
Ejemplo de Google:
El algoritmo de Google utiliza este sistema para recopilar y proporcionar a los usuarios finales información relevante para sus consultas.
El grafo de conocimiento de Google contiene más de 500 millones de objetos, así como más de 3.500 millones de datos y relaciones entre estos diferentes objetos.
Su gráfico de conocimiento mejora la Búsqueda de Google de tres formas principales:
- Encuentre lo que busca: Busca no solo por palabras clave, sino por su significado.
- Obtenga el mejor resumen: Recopila la información más relevante de varias fuentes en función de la intención.
- Profundice y amplíe su búsqueda: Descubre más de lo que esperabas gracias a las sugerencias pertinentes.
¿Cómo potencian los gráficos de conocimiento los usos del catálogo de datos?
Impulsados por un catálogo de datos, los gráficos de conocimiento pueden beneficiar a su empresa en su estrategia de datos a través de:
Resultados de búsqueda ricos y detallados
Hoy en día, muchos motores de búsqueda utilizan múltiples grafos de conocimiento para ir más allá de la búsqueda básica basada en palabras clave. Los grafos de conocimiento permiten a estos motores de búsqueda comprender conceptos, entidades y las relaciones entre ellos. Entre sus ventajas se incluyen:
- La capacidad de ofrecer resultados más profundos y pertinentes, incluidos hechos y relaciones, en lugar de meros documentos.
- La capacidad de formular búsquedas como preguntas u oraciones, en lugar de como una lista de palabras.
- Capacidad para comprender búsquedas complejas que hacen referencia a conocimientos que se encuentran en múltiples elementos utilizando las relaciones definidas en el gráfico.
Descubrimiento optimizado de datos
Los datos empresariales se mueven de un lugar a otro a la velocidad de la luz, y se almacenan en diversas fuentes de datos y aplicaciones de almacenamiento. Los empleados y socios acceden a estos datos desde cualquier lugar y en cualquier momento, por lo que identificar, localizar y clasificar sus datos para protegerlos y obtener información de ellos debe ser la prioridad.
Las ventajas de los grafos de conocimiento para descubrimiento de datos incluyen:
- Una mejor comprensión de los datos de la empresa, dónde están, quién puede acceder a ellos y dónde, y cómo se transmitirán.
- Clasificación automática de datos basada en el contexto.
- Gestión de riesgos y cumplimiento de la normativa.
- Visibilidad total de los datos.
- Identificación, clasificación y seguimiento de datos sensibles.
- La capacidad de aplicar controles de protección a los datos en tiempo real basándose en políticas predefinidas y factores contextuales.
- Evaluar adecuadamente el panorama completo de los datos.
Por un lado, ayuda a aplicar las medidas de seguridad adecuadas para prevenir la pérdida de datos sensibles y evitar consecuencias financieras y de reputación devastadoras para la empresa. Por otro, permite a los equipos profundizar en el contexto de los datos para identificar los elementos específicos que revelan las respuestas y encontrar la manera de responder a sus preguntas.
Recomendaciones inteligentes
Como se menciona en la introducción, los servicios de recomendación son ahora un componente familiar de muchas tiendas en línea, asistentes personales y plataformas digitales.
Las recomendaciones deben adoptar un enfoque basado en el contenido. Dentro de un catálogo de datos, las capacidades de aprendizaje automático combinadas con un grafo de conocimiento, podrán detectar determinados tipos de datos, aplicar etiquetas o reglas estadísticas sobre los datos para ejecutar sugerencias de activos eficaces e inteligentes.
Esta capacidad también se conoce como reconocimiento de patrones de datos. Se refiere a ser capaz de identificar activos similares y basarse en algoritmos estadísticos y capacidades de ML que se derivan de otros sistemas de reconocimiento de patrones.
Este sistema de reconocimiento de patrones de datos ayuda a los administradores de datos a mantener su gestión de metadatos:
- Identificar duplicados y copiar metadatos
- Detectar tipos de datos lógicos (correos electrónicos, ciudades, direcciones, etc.)
- Sugerir valores de atributos (reconocer patrones de documentación para aplicarlos a un objeto similar o a uno nuevo)
- Sugerir enlaces - semánticos o de linaje
- Detectar posibles errores para ayudar a mejorar la calidad y pertinencia del catálogo.
La idea es utilizar algunas técnicas derivadas de las recomendaciones basadas en contenidos que se encuentran en los catálogos de uso general. Cuando el usuario haya encontrado algo, el catálogo le sugerirá alternativas basadas tanto en su perfil como en el reconocimiento de patrones.
Algunos casos de uso del catálogo de datos potenciados por los grafos de conocimiento
- Recopilación de activos utilizados o relacionados con causas de fallo en proyectos digitales.
- Encontrar activos con intereses particulares alineados con nuevos productos para el departamento de marketing.
- Generando vistas completas de 360 de personas y empresas en el departamento de ventas.
- Adecuación de las necesidades de la empresa con las personas y los proyectos de RRHH.
- Encontrando reglamentos relativos a contratos e inversiones específicos activos en el departamento financiero.
Conclusión
Con el incesante aumento de datos en las empresas, organizar su información sin una estrategia significa no poder seguir siendo competitivo y relevante en la era digital. Asegurarse de que su catálogo de datos cuenta con un Knowledge Graph empresarial es esencial para evitar el temido efecto "caja negra".
Mediante un grafo de conocimiento en combinación con IA y algoritmos de aprendizaje automático, sus datos tendrán más contexto y le permitirán no solo descubrir patrones más profundos y sutiles, sino también tomar decisiones más inteligentes.
Para saber más sobre qué es un gráfico de conocimiento, aquí tiene un magnífico artículo del analista de BARC Timm Grosser "Linked Data for Analytics?" (¿Datos enlazados para análisis?)
Comience su viaje por el catálogo de datos
Actian Data Intelligence Platform es una solución 100% basada en la nube, disponible en cualquier parte del mundo con solo unos clics. Al elegir el catálogo de datos de Actian Data Intelligence Platform, controle los costes asociados a la implementación y el mantenimiento de un catálogo de datos, al tiempo que simplifica el acceso de sus equipos.
Los mecanismos de alimentación automática, así como los algoritmos de sugerencia y corrección, reducen los costes globales de un catálogo y garantizan a sus equipos de datos una información de calidad en un tiempo récord.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.