Ir al contenido
  • HCLSoftware
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • Iniciar sesión
Un logotipo gráfico de la empresa Actian
  • Productos Productos
    • icono azul de datos para Actian

      Datos + Inteligencia Artificial

      Plataforma Actian Data Intelligence Nuevo
      Encuentre, confíe y desbloquee el valor de los datos con una plataforma completa de gobernanza y mercado
      Observabilidad de datos Actian Nuevo
      Calidad y observabilidad de los datos basada en IA para una arquitectura abierta
      Actian Data Platform
      Conecte, gestione y analice sus datos de forma sencilla, con una plataforma unificada.
    • icono azul de base de datos para Actian

      Bases de datos

      • Zen
        Base de datos integrada de bajo mantenimiento
      • Actian NoSQL
        Bases de datos para redes complejas de objetos
      • Actian Ingres
        Procesamiento transaccional escalable y fiable
      • HCL Informix®
        Gestión de datos empresariales rápida y optimizada en costes
    • icono azul de gráfico de líneas para Actian

      Análisis

      • Vector
        Base de datos analítica columnar vectorizada de alto rendimiento
    • integraciones

      Gestión de datos

      • DataConnect
        Solución de integración híbrida muy escalable
      • Calidad de los datos
        Tome decisiones bien fundadas y que impulsan su negocio
      • DataFlow
        Plataforma de ejecución paralela de datos en tránsito
    • Icono azul de gráfico de barras

      Modernización de aplicaciones

      • OpenROAD
        Desarrollo rápido de aplicaciones orientadas a objetos de bases de datos
      • VoltMX
        Plataforma de desarrollo de aplicaciones de poco código
    • Ver todos los productos de Actian
    • cuadrado azul con flecha derecha hacia arriba

      Implementación

      Implementación

      Nube, entornos híbridos e instalaciones

      • Google Cloud Inicie su viaje a Google con Actian
      • Servicios web de Amazon Inicie su viaje a AWS con Actian
      • Microsoft Azure Inicie su viaje a Azure con Actian
    Ver todos los productos de Actian Explore todos los socios de implementación
  • Soluciones Soluciones

    Soluciones por sector

    • Fabricación
    • Transporte y logística
    • Banca, servicios financieros y seguros
    • Sanidad y ciencias de la vida
    • Comercio minorista y bienes de consumo
    • Energía y servicios públicos

    Casos prácticos

    • Icono GenAI
      Preparación de datos para GenAI Una lista rápida de comprobación para evaluar su preparación para la GenAI
    • icono azul  de capa para Actian
      Integración flexible de datos Recopile, transforme y automatice las canalizaciones de datos
    • icono azul de base de datos
      Modernización del almacén de datos Migración simplificada y de bajo riesgo a un almacén de datos moderno, implementado en las instalaciones y en varias nubes
    • icono azul de soluciones de comunicación
      Enterprise Data Marketplace Descubra productos de datos, acceda a ellos y compártalos
    • icono azul de nube para Actian
      Análisis del borde a la nube Modernice el procesamiento y análisis de datos de aplicaciones en el borde
    • icono azul de gráfico de flujo de datos para Actian
      Centro de análisis de datos de clientes Obtenga información del cliente procesable en tiempo real, de todos sus silos de datos de experiencia de cliente
    Explore todas las soluciones del sector
  • Clientes Clientes

    Clientes

    • icono azul de usuarios para actian
      Nuestros clientes Únase a una creciente comunidad de empresas de diversos sectores que confían en Actian para aprovechar el poder de sus datos.

    Casos de éxito de clientes

    • icono azul de usuario para actian
      Academy Bank
    • icono azul de usuario para actian
      Tsubakimoto
    Ver todos los clientes
  • Socios Socios

    Socios

    • icono azul de cuadrado de información para Actian
      Resumen del programa Soluciones competitivas, incentivos líderes en el sector y un completo paquete de asistencia
    • icono azul de verificación para Actian
      Hágase socio Acelere su negocio con el Programa de Socios de Actian
    • icono azul Bezier para Actian
      Socios tecnológicos Asociarse para crear un multiplicador de fuerzas
    • icono azul de usuario para actian
      Recomiende a un cliente potencial Proteja a su cliente, haga crecer su negocio
    • Icono de búsqueda de socios
      Busque un socio Aproveche la experiencia y los conocimientos de nuestra red de socios
  • Aprenda Aprenda

    Aprenda

    • Icono de sangría izquierda de imagen
      Blog
    • icono azul de gorro de graduación
      Academia Actian
    • icono azul de libro
      Recursos
    • icono azul con papel y lupa para Actian
      Guías
    • cuadrado azul
      Seminarios en línea
    • logotipo azul de lista
      Glosario
    Ver todos los recursos
  • Empresa Empresa

    Empresa

    • logotipo azul de Actian
      Quiénes somos
    • icono azul de anuncio
      Redacción
    • icono azul de pregunta
      Acerca de HCLSoftware
    • icono azul de maletín para Actian
      Carreras profesionales
    • icono azul de usuarios de Actian
      Liderazgo
    • icono azul de verificación para Actian
      Premios y reconocimientos
    • Icono azul de calendario
      Eventos
    • icono azul de mensaje
      Contacte con nosotros
    Más información sobre Actian
Visita guiada Solicitar demostración Iniciar sesión
  • Asistencia
  • Comunidad
  • Descargas
  • Documentación
  • HCLSoftware
Más información sobre nuestras soluciones de datos
Contacte con nosotros
Inteligencia de datos

Amundsen: Cómo Lyft puede descubrir fácilmente sus datos

Corporación Actian

27 de febrero de 2020

un coche de alquiler con el logotipo de lyft

Últimas entradas del blog

Manténgase al día de las últimas tendencias en datos

Suscríbase a

En nuestro último artículo, hablamos de Databook de Uber, una plataforma interna diseñada por sus propios ingenieros con el objetivo de convertir los datos en activos contextualizados. En este artículo, nos centraremos en la plataforma de metadatos y descubrimiento de datos de Lyft: Amundsen.

En respuesta al éxito de Uber, el mercado de los viajes compartidos vio llegar una importante oleada de competidores y, entre ellos, se encuentra Lyft.

Cifras clave y estadísticas de Lyft

Fundada en 2012 en San Francisco, Lyft opera en más de 300 ciudades de Estados Unidos y Canadá. Con más del 29% del mercado estadounidense de viajes compartidos*, Lyft se ha asegurado sin duda la segunda posición, codo con codo con Uber. Algunas estadísticas clave sobre Lyft son:

  • 23 millones de usuarios de Lyft en enero de 2018.
  • Más de mil millones de viajes con Lyft.
  • 1,4 millones de conductores (dic. 2017).

Y, por supuesto, esas cifras se han transformado en cantidades colosales de datos que gestionar. En una empresa moderna impulsada por los datos como Lyft, es evidente que la plataforma está impulsada por los datos. Con el rápido aumento del panorama de datos, cada vez es más difícil saber qué datos existen, cómo acceder a ellos y qué información está disponible.

Este problema llevó a la creación de Amundsen, la solución de descubrimiento de datos y plataforma de metadatos de código abierto de Lyft.

Conozcamos a Amundsen

Lyft, que toma su nombre del explorador noruego Roald Amundsen, mejora la productividad de sus usuarios de datos ofreciéndoles una interfaz de búsqueda intuitiva de datos, que tiene este aspecto:

Aunque los científicos de datos de Lyft querían dedicar la mayor parte del tiempo al desarrollo y la producción de modelos, se dieron cuenta de que dedicaban la mayor parte de su tiempo al descubrimiento de datos. Se hacían preguntas como las siguientes:

  • ¿Existen estos datos? En caso afirmativo, ¿dónde puedo encontrarlos? ¿Puedo acceder a ellos?
  • ¿Quién / qué equipo es el propietario? ¿Quiénes son los usuarios comunes?
  • ¿Puedo fiarme de estos datos?

Para responder a estas preguntas, Lyft se inspiró en motores de búsqueda como Google.

Como se muestra más arriba, su punto de entrada es un sencillo cuadro de búsqueda en el que los usuarios pueden escribir cualquier palabra clave, como "clientes" "empleados" o "precio". Sin embargo, si el usuario de datos no sabe lo que busca, la plataforma le presenta una lista de las tablas más populares, para que pueda navegar libremente por ellas.

Algunas características clave:

Los resultados de la búsqueda se muestran en "forma de lista", donde aparece la descripción sobre la tabla y la fecha de su última actualización. La clasificación utilizada es similar al Page Rank de Google, donde las tablas más populares y relevantes aparecen en los primeros resultados.

Cuando un usuario de datos en Lyft encuentra lo que busca y selecciona su opción, se le dirige a una página de detalles que muestra el nombre del cuadro, así como su descripción curada manualmente. Los usuarios también pueden insertar manualmente etiquetas, los propietarios y otras descripciones. Sin embargo, muchos de sus metadatos se seleccionan automáticamente, como la popularidad de la mesa o incluso sus usuarios frecuentes.

Cuando están en una tabla, los usuarios pueden explorar las columnas asociadas para descubrir más a fondo los metadatos de la tabla.

Por ejemplo, si selecciona la columna "distancia_viajada" como se muestra a continuación, encontrará una pequeña definición del campo y sus estadísticas relacionadas, como el registro de recuento, el recuento máximo, el recuento mínimo, el recuento medio, etc., para que los científicos de datos comprendan mejor la forma de sus datos.

Por último, los usuarios pueden acceder a ver los datos del conjunto de datos pulsando el botón de vista previa de la página. Por supuesto, esto sólo es posible si el usuario tiene acceso a los datos subyacentes en primer lugar.

Amundsen democratiza la búsqueda de datos

Mostrar los datos pertinentes

Amundsen permite ahora a todos los empleados de Lyft, desde los nuevos hasta los más experimentados, ser autónomos en el descubrimiento de datos para sus tareas diarias.

Ahora hablemos de técnica. El almacén de datos de Lyft está en Hive y todas las particiones físicas se almacenan en S3. Sus usuarios de datos confían en Presto, un motor de consulta en vivo, para el descubrimiento de sus tablas. Para que su motor de búsqueda muestre las tablas más importantes o relevantes para sus usuarios, Lyft utiliza el framework DataBuilder para construir un extractor de uso de consultas que analiza los registros de consultas para obtener datos de uso de tablas. A continuación, persisten en este uso de la tabla como un documento de tabla Elasticsearch. Y así es como, en muy poco tiempo, son capaces de recuperar los conjuntos de datos más relevantes para sus usuarios de datos.

Conectar los datos con las personas

Por mucho que nos guste afirmar lo técnicos y digitales que somos todos, los procesos de búsqueda de datos consisten principalmente en interacciones con personas. Y la noción de propiedad de los datos es bastante confusa; lleva mucho tiempo a menos que se sepa exactamente a quién preguntar.

Amundsen aborda este problema creando relaciones entre sus usuarios y sus datos, de modo que el conocimiento tribal se comparte a través de la exposición de estas relaciones.

Lyft tiene actualmente tres tipos de relaciones entre usuarios y datos: seguidos, propios y usados. Esta información ayuda a los empleados experimentados a convertirse en recursos útiles para otros empleados con una función laboral similar. Amundsen también hace que el conocimiento tribal sea más fácil de encontrar gracias a un enlace a cada perfil de usuario en el directorio interno de empleados.

También han estado trabajando en la implementación de una función de notificaciones que permita a los usuarios solicitar más información a los propietarios de los datos como, por ejemplo, la falta de una descripción en una tabla.

Si desea más información sobre Amundsen, visite su sitio web aquí.

El futuro de Lyft

Lyft espera seguir trabajando con una comunidad cada vez mayor para mejorar su experiencia de descubrimiento de datos y aumentar la productividad de los usuarios. Su hoja de ruta incluye actualmente un sistema de notificaciones por correo electrónico, linaje de datos, rediseño de la interfaz de usuario y la interfaz de usuario, ¡y mucho más!

La empresa de viajes compartidos aún no ha dicho su última palabra.

Fuentes:

Lyft - Estadísticas y datos: https://www.statista.com/topics/4919/lyft/
Lyft y su camino hacia el éxito: https://www.startupstories.in/stories/lyft-and-its-drive-through-to-success
Estadísticas de ingresos y uso de Lyft (2019): https://www.businessofapps.com/data/lyft-statistics/
Infraestructura Presto en Lyft: https://eng.lyft.com/presto-infrastructure-at-lyft-b10adb9db01?gi=f100fa852946
Open Sourcing Amundsen: una plataforma de descubrimiento de datos y metadatos: https://eng.lyft.com/open-sourcing-amundsen-a-data-discovery-and-metadata-platform-2282bb436234
Amundsen: el motor de descubrimiento de datos y metadatos de Lyft: https://eng.lyft.com/amundsen-lyfts-data-discovery-metadata-engine-62d27254fbb9

logo avatar actian

Acerca de Actian Corporation

Actian hace que trabajar con datos sea fácil. Nuestra plataforma de datos simplifica la forma en que las personas conectan, gestionan y analizan datos en entornos cloud, híbridos y locales. Con décadas de experiencia en gestión y analítica de datos, Actian ofrece soluciones de alto rendimiento que ayudan a las empresas a tomar decisiones basadas en datos. Estamos reconocidos por los principales analistas del sector y hemos recibido premios por nuestro rendimiento e innovación. Nuestros equipos comparten casos de éxito en conferencias (como Strata Data) y contribuyen activamente a proyectos de código abierto. En el blog de Actian tratamos temas como la ingesta de datos en tiempo real, el análisis de datos, la gobernanza y gestión de datos, la calidad de los datos, la inteligencia de datos y el análisis impulsado por IA.
  • Descubrimiento de datos
  • métadonnées Gestión
  • Compartir con Icono de Twitter
  • Compartir conIcono de LinkedIn
  • Compartir conIcono de Facebook
  • Compartir conIcono de correo

Suscríbase al blog de Actian

Suscríbase al blog de Actian para recibir información sobre datos directamente en su correo electrónico.

  • Manténgase informado: reciba lo último en análisis de datos directamente en su bandeja de entrada.
  • No se pierda ni una publicación: recibirá actualizaciones automáticas por correo electrónico que le avisarán cuando se publiquen nuevas publicaciones.
  • Todo depende de usted: cambie sus preferencias de entrega para adaptarlas a sus necesidades.

Suscríbase a

Esta extensión de correo electrónico () no está permitida. Por favor, actualícela.
Este dominio de dirección de correo electrónico personal () no está permitido. Por favor, actualícelo.

Gracias por suscribirse al blog de Actian.

Prepárese para mantenerse informado e inspirado con las últimas ideas, tendencias y actualizaciones en el mundo del análisis de datos y la tecnología.

Pronto recibirá en su bandeja de entrada nuestros artículos, estudios de casos y noticias del sector, cuidadosamente seleccionados.

También puede interesarle:
  • Inteligencia de datos para unas decisiones más inteligentes
  • ¿Está su organización preparada para la GenAI?
  • Obtenga una visión completa del cliente

Datos + Inteligencia Artificial

  • Plataforma de inteligencia de datos Actian
  • Actian Data Observability
  • Actian Data Platform

Capacidades

  • Análisis de datos
  • Bases de datos
  • Integración y calidad de datos
  • Servicios de aplicación

Soluciones

  • Fabricación
  • Servicios financieros
  • Análisis de datos sanitarios
  • Transporte y logística
  • Comunicaciones

Empresa

  • Acerca de Actian
  • Acerca de HCLSoftware
  • Eventos
  • Premios y reconocimientos
  • Redacción
  • Prensa
  • Carreras profesionales
  • Ubicaciones

Clientes

  • Asistencia
  • Comunidad
  • Documentación
  • Iniciar sesión en el portal del cliente
  • Iniciar sesión en Actian Data Platform

Comenzar

  • Solicite una demostración
  • Contacte con nosotros
Actian
© 2025 Actian Corporation. Todos los derechos reservados.
  • icono social x
  • facebook
  • Linkedin
  • GitHub
  • youtube
  • Condiciones de uso
  • Política sobre esclavitud moderna
  • Política de privacidad
  • Directrices sobre marcas registradas
  • Patentes
  • Seguridad
logotipo-hcl