Ir al contenido
  • HCLSoftware
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • Iniciar sesión
Un logotipo gráfico de la empresa Actian
  • Productos Productos
    • icono azul de datos para Actian

      Datos + Inteligencia Artificial

      Plataforma Actian Data Intelligence Nuevo
      Encuentre, confíe y desbloquee el valor de los datos con una plataforma completa de gobernanza y mercado
      Observabilidad de datos Actian Nuevo
      Calidad y observabilidad de los datos basada en IA para una arquitectura abierta
      Actian Data Platform
      Conecte, gestione y analice sus datos de forma sencilla, con una plataforma unificada.
    • icono azul de base de datos para Actian

      Bases de datos

      • Zen
        Base de datos integrada de bajo mantenimiento
      • Actian NoSQL
        Bases de datos para redes complejas de objetos
      • Actian Ingres
        Procesamiento transaccional escalable y fiable
      • HCL Informix®
        Gestión de datos empresariales rápida y optimizada en costes
    • icono azul de gráfico de líneas para Actian

      Análisis

      • Vector
        Base de datos analítica columnar vectorizada de alto rendimiento
    • integraciones

      Gestión de datos

      • DataConnect
        Solución de integración híbrida muy escalable
      • Calidad de los datos
        Tome decisiones bien fundadas y que impulsan su negocio
      • DataFlow
        Plataforma de ejecución paralela de datos en tránsito
    • Icono azul de gráfico de barras

      Modernización de aplicaciones

      • OpenROAD
        Desarrollo rápido de aplicaciones orientadas a objetos de bases de datos
      • VoltMX
        Plataforma de desarrollo de aplicaciones de poco código
    • Ver todos los productos de Actian
    • cuadrado azul con flecha derecha hacia arriba

      Implementación

      Implementación

      Nube, entornos híbridos e instalaciones

      • Google Cloud Inicie su viaje a Google con Actian
      • Servicios web de Amazon Inicie su viaje a AWS con Actian
      • Microsoft Azure Inicie su viaje a Azure con Actian
    Ver todos los productos de Actian Explore todos los socios de implementación
  • Soluciones Soluciones

    Soluciones por sector

    • Fabricación
    • Transporte y logística
    • Banca, servicios financieros y seguros
    • Sanidad y ciencias de la vida
    • Comercio minorista y bienes de consumo
    • Energía y servicios públicos

    Casos prácticos

    • Icono GenAI
      Preparación de datos para GenAI Una lista rápida de comprobación para evaluar su preparación para la GenAI
    • icono azul  de capa para Actian
      Integración flexible de datos Recopile, transforme y automatice las canalizaciones de datos
    • icono azul de base de datos
      Modernización del almacén de datos Migración simplificada y de bajo riesgo a un almacén de datos moderno, implementado en las instalaciones y en varias nubes
    • icono azul de soluciones de comunicación
      Enterprise Data Marketplace Descubra productos de datos, acceda a ellos y compártalos
    • icono azul de nube para Actian
      Análisis del borde a la nube Modernice el procesamiento y análisis de datos de aplicaciones en el borde
    • icono azul de gráfico de flujo de datos para Actian
      Centro de análisis de datos de clientes Obtenga información del cliente procesable en tiempo real, de todos sus silos de datos de experiencia de cliente
    Explore todas las soluciones del sector
  • Clientes Clientes

    Clientes

    • icono azul de usuarios para actian
      Nuestros clientes Únase a una creciente comunidad de empresas de diversos sectores que confían en Actian para aprovechar el poder de sus datos.

    Casos de éxito de clientes

    • icono azul de usuario para actian
      Academy Bank
    • icono azul de usuario para actian
      Tsubakimoto
    Ver todos los clientes
  • Socios Socios

    Socios

    • icono azul de cuadrado de información para Actian
      Resumen del programa Soluciones competitivas, incentivos líderes en el sector y un completo paquete de asistencia
    • icono azul de verificación para Actian
      Hágase socio Acelere su negocio con el Programa de Socios de Actian
    • icono azul Bezier para Actian
      Socios tecnológicos Asociarse para crear un multiplicador de fuerzas
    • icono azul de usuario para actian
      Recomiende a un cliente potencial Proteja a su cliente, haga crecer su negocio
    • Icono de búsqueda de socios
      Busque un socio Aproveche la experiencia y los conocimientos de nuestra red de socios
  • Aprenda Aprenda

    Aprenda

    • Icono de sangría izquierda de imagen
      Blog
    • icono azul de gorro de graduación
      Academia Actian
    • icono azul de libro
      Recursos
    • icono azul con papel y lupa para Actian
      Guías
    • cuadrado azul
      Seminarios en línea
    • logotipo azul de lista
      Glosario
    Ver todos los recursos
  • Empresa Empresa

    Empresa

    • logotipo azul de Actian
      Quiénes somos
    • icono azul de anuncio
      Redacción
    • icono azul de pregunta
      Acerca de HCLSoftware
    • icono azul de maletín para Actian
      Carreras profesionales
    • icono azul de usuarios de Actian
      Liderazgo
    • icono azul de verificación para Actian
      Premios y reconocimientos
    • Icono azul de calendario
      Eventos
    • icono azul de mensaje
      Contacte con nosotros
    Más información sobre Actian
Visita guiada Solicitar demostración Iniciar sesión
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • HCLSoftware
Más información sobre nuestras soluciones de datos
Contacte con nosotros
Inteligencia de datos

WhereHows: Un portal de descubrimiento de datos y linaje para LinkedIn

Corporación Actian

20 de abril de 2020

linkedin-donde-se-presenta

Últimas entradas del blog

Manténgase al día de las últimas tendencias en datos

Suscríbase a

Los metadatos son cada vez más importantes para las empresas modernas basadas en datos. En un mundo en el que el panorama de los datos aumenta a un ritmo vertiginoso y los sistemas de información son cada vez más complejos, las organizaciones de todos los sectores han comprendido la importancia de ser capaces de descubrir, comprender y confiar en sus activos de datos.

Tanto si su empresa pertenece al sector del streaming, como Spotify o Netflix, al de los viajes compartidos, como Uber o Lyft, o incluso al de los alquileres, como Airbnb, es esencial que los equipos de datos cuenten con las herramientas y soluciones adecuadas que les permitan innovar y generar valor con sus datos. equipados con las herramientas y soluciones adecuadas que les permitan innovar y producir valor con sus datos.

En este artículo, nos centraremos en WhereHows, un proyecto de código abierto dirigido por el equipo de datos de LinkedIn, que funciona creando un repositorio central y un portal para personas, procesos y conocimientos en torno a los datos. Con más de 50 mil conjuntos de datos, 14 mil comentarios y 35 millones de ejecuciones de trabajo e información de linaje relacionada, está claro que el portal de descubrimiento de datos de LinkedIn es un éxito.

Estadísticas clave de LinkedIn

Fundada por Reid Hoffman, Allen Blue, Konstantin Guericke, Eric Ly y Jean-Luc Vaillant en 2003 en California, la empresa empezó muy lentamente. En 2007, por fin fueron rentables, y en 2011 contaban con más de 100 millones de miembros en todo el mundo.

A partir de 2020, LinkedIn creció significativamente:

  • Más de 660 millones de miembros de LinkedIn en todo el mundo, con 206 millones de usuarios activos en Europa.
  • Más de 80 millones de usuarios en LinkedIn Slideshare.
  • Más de 9.000 millones de impresiones de contenidos.
  • 30 millones de empresas registradas en todo el mundo.

LinkedIn es sin duda una aplicación de red social profesional imprescindible para reclutadores, vendedores e incluso profesionales de ventas. Entonces, ¿cómo consigue el Gigante de Internet mantener al día todos estos datos?

Cómo empezó todo

Como la mayoría de las empresas con un ecosistema de BI maduro, LinkedIn comenzó con un equipo de almacén de datos, responsable de integrar diversas fuentes de información en conjuntos de datos dorados consolidados. A medida que crecía el número de conjuntos de datos, productores y consumidores, el equipo se sentía cada vez más abrumado por la colosal cantidad de datos que se generaban cada día. Algunas de sus preguntas eran:

  • ¿Quién es el propietario de este flujo de datos?
  • ¿Cómo han llegado estos datos hasta aquí?
  • ¿Dónde están los datos?
  • ¿Qué datos se utilizan?

En respuesta, LinkedIn decidió crear un repositorio central de metadatos para capturar sus metadatos en todos los sistemas y mostrarlos a través de una plataforma única para simplificar el descubrimiento de datos: WhereHows.

¿Qué es WhereHows?

WhereHows se integra con todos los entornos de procesamiento de datos y extrae metadatos de ellos.

A continuación, saca a la superficie esta información a través de dos interfaces diferentes:

  1. Una aplicación web que permite navegación, búsqueda, visualización de linajes, debates y colaboración.
  2. Un punto final de API que permite la automatización de otros procesos y aplicaciones de datos.

Este repositorio permite a LinkedIn resolver problemas relacionados con el linaje de los datos, la propiedad de los datos, el descubrimiento de esquemas, la combinación de metadatos operativos, la creación de perfiles de datos y la comparación entre clústeres. Además, implementaron detección y asociación de patrones basados en máquinas entre el glosario empresarial y sus conjuntos de datosy crearon una comunidad basada en la participación y la colaboración que les permite mantener la documentación de metadatos fomentando las conversaciones y el orgullo de propiedad.

WhereHows tiene tres componentes principales:

  1. Un repositorio de datos que almacena todos los metadatos.
  2. Un servidor web que muestra datos a través de la API y la interfaz de usuario.
  3. Un servidor backend que obtiene metadatos de otras fuentes de información.

¿Cómo funciona WhereHows?

La potencia de WhereHows proviene de los metadatos que recoge del ecosistema de datos de Linkedin. Recopila los siguientes metadatos:

  • Metadatos operativos, como trabajos, flujos, etc.
  • Información de linaje, que es lo que conecta los conjuntos de datos de los empleos.
  • La información catalogada, como la ubicación del conjunto de datos, su estructura de esquema, la propiedad, la fecha de creación, etc.

Cómo utilizan los metadatos

WhereHows utiliza un modelo universal que permite a los equipos de datos aprovechar mejor el valor de los metadatos; por ejemplo, realizando una búsqueda en las distintas plataformas basada en diferentes aspectos de los conjuntos de datos.

Además, los metadatos de un conjunto de datos y los metadatos operativos del trabajo son dos puntos finales. La información de linaje los conecta y permite a los equipos de datos rastrear desde un conjunto de datos/trabajo hasta sus trabajos/conjuntos de datos anteriores/posteriores. Si todo el ecosistema de datos se recopila en WhereHows, pueden rastrear el flujo de datos de principio a fin.

Cómo recopilan los metadatos

El método utilizado para recopilar metadatos depende de la fuente. Por ejemplo, los conjuntos de datos de Hadoop tienen tareas de raspado que escanean las carpetas y archivos de HDFS, leen los metadatos y los vuelven a almacenar.

Para programadores como Azkaban, conectan su repositorio backend para obtener los metadatos, los agregan y los transforman al formato que necesitan, y luego los cargan en WhereHows. Para la información de linaje, analizan el registro de un trabajo MapReduce y el registro de ejecución de un programador, y combinan esa información para obtener el linaje.

¿Qué sigue para WhereHows?

En la actualidad, WhereHows se utiliza activamente en LinkedIn no solo como repositorio de metadatos, sino también para automatizar otros proyectos de datos, como la depuración automatizada de datos para el cumplimiento normativo. En 2016, se integraron con los sistemas de abajo:

En el futuro, los equipos de datos de LinkedIn esperan ampliar su cobertura de metadatos integrando más sistemas como Kafka o Samza. También planean integrarse con sistemas de gestión del ciclo de vida de los datos y de aprovisionamiento como Nuage o Goblin para enriquecer los metadatos. WhereHows no ha dicho su última palabra.

Fuentes:

  • Las 50 estadísticas más importantes de LinkedIn para 2020
  • Open Sourcing WhereHows: Un portal de descubrimiento de datos y linajes
logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.
  • métadonnées Gestión
  • Compartir con Icono de Twitter
  • Compartir conIcono de LinkedIn
  • Compartir conIcono de Facebook
  • Compartir conIcono de correo

Suscríbase al blog de Actian

Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.

  • Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
  • No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
  • Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.

Suscríbase a

Esta extensión de correo electrónico () no está permitida. Por favor, actualícela.
Este dominio de dirección de correo electrónico personal () no está permitido. Por favor, actualícelo.

Gracias por suscribirse al blog de Actian.

Prepárese para mantenerse informado e inspirado con las últimas ideas, tendencias y actualizaciones en el mundo del análisis de datos y la tecnología.

Pronto recibirá en su bandeja de entrada nuestros artículos, estudios de casos y noticias del sector, cuidadosamente seleccionados.

También puede interesarle:
  • Inteligencia de datos para unas decisiones más inteligentes
  • ¿Está su organización preparada para la GenAI?
  • Obtenga una visión completa del cliente

Datos + Inteligencia Artificial

  • Plataforma de inteligencia de datos Actian
  • Actian Data Observability
  • Actian Data Platform

Capacidades

  • Análisis de datos
  • Bases de datos
  • Integración y calidad de datos
  • Servicios de aplicación

Soluciones

  • Fabricación
  • Servicios financieros
  • Análisis de datos sanitarios
  • Transporte y logística
  • Comunicaciones

Empresa

  • Acerca de Actian
  • Acerca de HCLSoftware
  • Eventos
  • Premios y reconocimientos
  • Redacción
  • Prensa
  • Carreras profesionales
  • Ubicaciones

Clientes

  • Asistencia
  • Comunidad
  • Documentación
  • Iniciar sesión en el portal del cliente
  • Iniciar sesión en Actian Data Platform

Comenzar

  • Solicite una demostración
  • Contacte con nosotros
Actian
© 2025 Actian Corporation. Todos los derechos reservados.
  • icono social x
  • facebook
  • Linkedin
  • GitHub
  • youtube
  • Condiciones de uso
  • Política sobre esclavitud moderna
  • Política de privacidad
  • Directrices sobre marcas registradas
  • Patentes
  • Seguridad
logotipo-hcl