Cómo la inteligencia artificial mejora los catálogos de datos
Corporación Actian
5 de junio de 2019

¿Pueden pensar las máquinas? Hablamos de la inteligencia artificial, "el mayor mito de nuestro tiempo".
Una definición sencilla de IA podría ser: "conjunto de teorías y técnicas aplicadas para crear máquinas capaces de simular inteligencia". Entre esas funciones de la IA, está el aprendizaje profundo, un método de aprendizaje automatizado utilizado para procesar datos.
Los datos deben ser comprensibles y accesibles. Es con la ayuda de un catálogo de datos inteligente que los usuarios de datos, como los científicos de datos, pueden investigar fácilmente y elegir de manera eficiente los conjuntos de datos adecuados para sus algoritmos de aprendizaje automático.
Veamos cómo.
Motor de búsqueda: Investigación de conjuntos de datos sobre facilitación
Al conectarse a todas las fuentes de datos de una empresa, un catálogo de datos puede extraer eficazmente la máxima cantidad de documentación (también conocida como metadatos) de sus sistemas de almacenamiento.
Esta información, indexada y filtrable en el motor de búsqueda de Actian Data Intelligence Platform, permite a los usuarios de datos obtener rápidamente los conjuntos de datos necesarios para sus sistemas de información.
Sistema de recomendaciones
Guiar a los científicos de datos en sus elecciones
Un catálogo de datos inteligente es una herramienta que se basa en la tecnología de "huella digital". Esta función inteligente ofrece recomendaciones a los usuarios de datos sobre qué conjuntos de datos son los más relevantes para sus proyectos en función de, entre otros:
- Cómo se utilizan los datos.
- La calidad y puntuación de la documentación.
- Sus búsquedas anteriores.
- Lo que buscan otros usuarios.
- Dar más sentido a sus conjuntos de datos.
Esta función ofrece a los usuarios de datos responsables de un conjunto de datos concreto algunas sugerencias en cuanto a su documentación. Estas recomendaciones pueden, por ejemplo, asociarse a etiquetas, contactos o incluso términos comerciales de otros conjuntos de datos basados en:
- El análisis sobre los propios datos (análisis estadístico).
- El esquema se asemeja a otros conjuntos de datos.
- Los enlaces en los campos del otro conjunto de datos.
- La contextualización automática de los conjuntos de datos en un catálogo de datos permite a cualquier usuario de datos trabajar con datos entendidos y apropiados para sus casos de uso.
Vinculación automática de conjuntos de datos: Visualice el ciclo de vida de sus datos
Como ya se ha mencionado, con la tecnología de huellas dactilares, un catálogo de datos puede reconocer y conectar con otros conjuntos de datos. Hablamos de linaje de datos: una representación visual de los ciclos de vida de los datos.
Detección automática de errores: Conozca los errores en los conjuntos de datos
Para superar los posibles problemas de interpretación de los datos, un catálogo de datos inteligente debe ser capaz de detectar automáticamente errores o malentendidos en la calidad y la documentación de cualquier dato.
Esta característica clave, basada en el análisis de los datos o su documentación, debe alertar a los usuarios de los datos sobre su integridad.
Notificación GDPR: Notificación de información sensible
Un catálogo de datos inteligente debe ser capaz de detectar datos personales/privados en cualquier conjunto de datos e informar de ello en su interfaz. Esta función ayuda a las empresas a responder a las diferentes exigencias del GDPR que entraron en vigor en mayo de 2018, y también a alertar a los usuarios potenciales sobre el nivel de sensibilidad, así como sobre el uso de sus datos.
Suscríbase al blog de Actian
Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.
- Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
- No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
- Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.