Inteligencia de datos

Cómo la inteligencia artificial mejora los catálogos de datos

Corporación Actian

5 de junio de 2019

La IA mejora los catálogos de datos

¿Pueden pensar las máquinas? Hablamos de la inteligencia artificial, "el mayor mito de nuestro tiempo".

Una definición sencilla de IA podría ser: "conjunto de teorías y técnicas aplicadas para crear máquinas capaces de simular inteligencia". Entre esas funciones de la IA, está el aprendizaje profundo, un método de aprendizaje automatizado utilizado para procesar datos.

Los datos deben ser comprensibles y accesibles. Es con la ayuda de un catálogo de datos inteligente que los usuarios de datos, como los científicos de datos, pueden investigar fácilmente y elegir de manera eficiente los conjuntos de datos adecuados para sus algoritmos de aprendizaje automático.

Veamos cómo.

Motor de búsqueda: Investigación de conjuntos de datos sobre facilitación

Al conectarse a todas las fuentes de datos de una empresa, un catálogo de datos puede extraer eficazmente la máxima cantidad de documentación (también conocida como metadatos) de sus sistemas de almacenamiento.

Esta información, indexada y filtrable en el motor de búsqueda de Actian Data Intelligence Platform, permite a los usuarios de datos obtener rápidamente los conjuntos de datos necesarios para sus sistemas de información.

Sistema de recomendaciones

Guiar a los científicos de datos en sus elecciones

Un catálogo de datos inteligente es una herramienta que se basa en la tecnología de "huella digital". Esta función inteligente ofrece recomendaciones a los usuarios de datos sobre qué conjuntos de datos son los más relevantes para sus proyectos en función de, entre otros:

  • Cómo se utilizan los datos.
  • La calidad y puntuación de la documentación.
  • Sus búsquedas anteriores.
  • Lo que buscan otros usuarios.
  • Dar más sentido a sus conjuntos de datos.

Esta función ofrece a los usuarios de datos responsables de un conjunto de datos concreto algunas sugerencias en cuanto a su documentación. Estas recomendaciones pueden, por ejemplo, asociarse a etiquetas, contactos o incluso términos comerciales de otros conjuntos de datos basados en:

  • El análisis sobre los propios datos (análisis estadístico).
  • El esquema se asemeja a otros conjuntos de datos.
  • Los enlaces en los campos del otro conjunto de datos.
  • La contextualización automática de los conjuntos de datos en un catálogo de datos permite a cualquier usuario de datos trabajar con datos entendidos y apropiados para sus casos de uso.

Vinculación automática de conjuntos de datos: Visualice el ciclo de vida de sus datos

Como ya se ha mencionado, con la tecnología de huellas dactilares, un catálogo de datos puede reconocer y conectar con otros conjuntos de datos. Hablamos de linaje de datos: una representación visual de los ciclos de vida de los datos.

Detección automática de errores: Conozca los errores en los conjuntos de datos

Para superar los posibles problemas de interpretación de los datos, un catálogo de datos inteligente debe ser capaz de detectar automáticamente errores o malentendidos en la calidad y la documentación de cualquier dato.

Esta característica clave, basada en el análisis de los datos o su documentación, debe alertar a los usuarios de los datos sobre su integridad.

Notificación GDPR: Notificación de información sensible

Un catálogo de datos inteligente debe ser capaz de detectar datos personales/privados en cualquier conjunto de datos e informar de ello en su interfaz. Esta función ayuda a las empresas a responder a las diferentes exigencias del GDPR que entraron en vigor en mayo de 2018, y también a alertar a los usuarios potenciales sobre el nivel de sensibilidad, así como sobre el uso de sus datos.

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.