Skip to content
  • HCLSoftware
  • Support
  • Communauté
  • Téléchargements
  • Documentation
  • Connexion
Un logo graphique de la société Actian
  • Produits Produits
    • Icône de données bleue pour Actian

      Données + Intelligence IA

      Actian Data Intelligence Platform Nouveau
      Trouver, faire confiance et libérer la valeur des données grâce à une plateforme complète de gouvernance et de marché
      Actian Data observabilité Nouveau
      Qualité et observabilité données basées sur l'IA et conçues pour une architecture ouverte
      plateforme de données Actian
      Connectez, gérez et analysez facilement vos données avec une plateforme unifiée
    • Icône de base de données bleue pour Actian

      Bases de données

      • Zen
        Base de données embarquée à faible maintenance
      • Actian NoSQL
        Bases de données pour les réseaux d'objets complexes
      • Actian Ingres
        Traitement transactionnel évolutif et fiable
      • HCL Informix
        Gestion des données d’entreprise rapide et économique
    • Icône de graphique en ligne bleue pour Actian

      Analytique

      • Vector
        Base analytique vectorisée haute performance
    • intégrations

      Gestion des données

      • DataConnect
        Solution d’intégration hybride hautement évolutive
      • Qualité des données
        Prenez des décisions éclairées qui stimulent votre activité
      • DataFlow
        Plateforme parallèle pour les données en mouvement
    • Icône bleue de l'histogramme

      Modernisation des applications

      • OpenROAD
        Développement d’applications objets et bases de données
      • VoltMX
        Plateforme de développement d’applications low-code
    • Voir tous les produits Actian
    • carré bleu avec flèche droite pointant vers le haut

      Déploiement

      Déploiement

      Cloud, hybride et sur site

      • Google Cloud Lancez votre voyage vers Google avec Actian
      • Amazon Web Services Lancez-vous dans l'aventure AWS avec Actian
      • Microsoft Azure Lancez votre voyage vers Azure avec Actian
    Voir tous les produits Actian Découvrez tous les partenaires de déploiement
  • Solutions Solutions

    Solutions par secteur

    • Industrie manufacturière
    • Transport et logistique
    • Banque, services financiers et assurance
    • Soins de santé et sciences de la vie
    • Commerce de détail et biens de consommation
    • Énergie et services publics

    Cas d’usage

    • Icône Gen AI
      Préparation des données pour la GénAI Liste de vérification rapide pour évaluer votre préparation à la GénAI
    • Icône de couche bleue pour Actian
      Intégration des données flexible Collectez, transformez et automatisez vos pipelines de données
    • icône bleue de la base de données
      Modernisation de l'entrepôt de données Migration simplifiée et à faible risque vers un entrepôt de données moderne, déployé sur site et sur plusieurs clouds
    • icône des solutions de communication bleues
      Marketplace de données d’entreprise Découvrez, accédez et partagez des produits de données
    • Icône de nuage bleu pour Actian
      Analytique Edge-to-Cloud Modernisez le traitement des données d’application et l’analytique à la périphérie
    • Icône de graphique de flux de données bleu pour Actian
      Hub analytique des données clients Obtenez des informations exploitables en temps réel sur l’ensemble de vos silos de données client
    Découvrez toutes les solutions par secteur
  • Clients Clients

    Clients

    • icône bleue des utilisateurs pour actian
      Nos clients Rejoignez une communauté grandissante d’entreprises de divers secteurs qui font confiance à Actian pour libérer tout le potentiel de leurs données.

    Histoires clients mises en avant

    • Icône bleue d'utilisateur pour actian
      Banque de l'Académie
    • Icône bleue d'utilisateur pour actian
      Tsubakimoto
    Voir tous les clients
  • Partenaires Partenaires

    Partenaires

    • Icône carrée bleue d'information pour Actian
      Présentation du programme Des solutions compétitives, des incitations de premier plan et un pack de support complet
    • Icône bleue de contrôle pour Actian
      Devenir partenaire Accélérez votre activité avec le programme partenaires Actian
    • Icône de Bézier bleue pour Actian
      Partenaires technologiques Des partenariats pour démultiplier la valeur des solutions
    • Icône bleue d'utilisateur pour actian
      Recommander une opportunité Protégez votre client, développez votre activité
    • Icône "Trouver un partenaire
      Trouver un partenaire Tirez parti de l’expertise et des insights de notre réseau de partenaires
  • Apprendre Apprendre

    Apprendre

    • Image Indent Left Icon
      Blog
    • chapeau de fin d'études icône bleue
      Actian Academy
    • livre icône bleu
      Ressources
    • Icône bleue avec papier et loupe pour Actian
      Guides
    • carré bleu
      Webinaires
    • logo de la liste bleue
      Glossaire
    • Icône de podcast
      Podcast
    Voir toutes les ressources
  • Entreprise Entreprise

    Entreprise

    • logo bleu d'Actian
      À propos
    • annonce icône bleue
      Salle de presse
    • question icône bleue
      A propos de HCLSoftware
    • Icône de mallette bleue pour Actian
      Carrières
    • icône bleue des utilisateurs Actian
      Équipe dirigeante
    • Icône bleue de contrôle pour Actian
      Prix et reconnaissance
    • Icône bleue du calendrier
      Événements
    • message icône bleue
      Nous contacter
    En savoir plus sur Actian
Visite guidée Demander une démo Se connecter
  • Support
  • Communauté
  • Téléchargements
  • Documentation
  • HCLSoftware
En savoir plus sur nos solutions de données
Nous contacter
Intelligence des données

Amundsen : Comment Lyft est capable de découvrir facilement ses données

Actian Corporation

27 février 2020

une voiture de location avec le logo lyft

Derniers articles de blog

Se tenir au courant des dernières tendances en matière de données

S'abonner

Dans notre dernier article, nous avons parlé du Databook d'Uber, une plateforme interne conçue par leurs propres ingénieurs dans le but de transformer les données en actifs contextualisés. Dans cet article, nous allons nous concentrer sur la découverte de données de Lyft. découverte de données et métadonnées de Lyft : Amundsen.

En réponse au succès d'Uber, le marché du covoiturage a vu arriver une importante vague de concurrents, parmi lesquels Lyft.

Chiffres clés et statistiques de Lyft

Fondée en 2012 à San Francisco, Lyft est présente dans plus de 300 villes aux États-Unis et au Canada. Avec plus de 29 % du marché américain du covoiturage*, Lyft s'est certainement assuré la deuxième place, au coude à coude avec Uber. Voici quelques statistiques clés sur Lyft :

  • 23 millions d'utilisateurs de Lyft en janvier 2018.
  • Plus d'un milliard de trajets en Lyft.
  • 1,4 million de conducteurs (déc. 2017).

Et bien sûr, ces chiffres se sont transformés en quantités colossales de données à gérer. Dans une entreprise moderne axée sur les données comme Lyft, il est évident que la plateforme est alimentée par les données. Avec l'augmentation rapide du patrimoine de données, il devient de plus en plus difficile de savoir quelles données existent, comment y accéder et quelles informations sont disponibles.

Ce problème a conduit à la création d'Amundsen, la solution de découverte de données et la plateforme de métadonnées open-source de Lyft.

Faisons connaissance avec Amundsen

Nommé d'après l'explorateur norvégien Roald Amundsen, Lyft améliore la productivité de ses utilisateurs de données en fournissant une interface de recherche intuitive pour les données, qui ressemble à ceci :

Alors que les data scientists de Lyft souhaitaient consacrer la majeure partie de leur temps au développement et à la production de modèles, ils se sont rendu compte qu'ils passaient le plus clair de leur temps à découverte de données. Ils se posaient des questions telles que :

  • Ces données existent-elles ? Si oui, où puis-je les trouver ? Puis-je y accéder ?
  • Qui / quelle équipe est le propriétaire ? Qui sont les utilisateurs communs ?
  • Puis-je me fier à ces données ?

Pour répondre à ces questions, Lyft s'est inspiré de moteurs de recherche comme Google.

Comme indiqué ci-dessus, leur point d'entrée est une simple boîte de recherche dans laquelle les utilisateurs peuvent taper n'importe quel mot-clé tel que "clients", "employés" ou "prix". Toutefois, si l'utilisateur utilisateur données ne sait pas ce qu'il cherche, la plateforme lui présente une liste des tableaux les plus populaires, afin qu'il puisse les parcourir librement.

Quelques caractéristiques clés :

Les résultats de la recherche sont affichés sous forme de liste où apparaissent la description du tableau et la date de sa dernière mise à jour. Le classement utilisé est similaire au Page Rank de Google, où les tableaux les plus populaires et les plus pertinents apparaissent dans les premiers résultats.

Lorsqu'un utilisateur utilisateur données chez Lyft trouve ce qu'il cherche et sélectionne son choix, il est dirigé vers une page détaillée qui affiche le nom de la table ainsi que sa description rédigée manuellement. Les utilisateurs peuvent également insérer manuellement des étiquettes, les propriétaires et d'autres descriptions. Cependant, une grande partie de leurs métadonnées est automatiquement gérée, comme la popularité de la table ou même ses utilisateurs fréquents.

Lorsqu'ils se trouvent dans un tableau, les utilisateurs peuvent explorer les colonnes associées afin de découvrir plus en détail les métadonnées du tableau.

Par exemple, si vous sélectionnez la colonne "distance_travelled" comme indiqué ci-dessous, vous trouverez une petite définition du champ et ses statistiques connexes telles que le nombre d'enregistrement, le nombre maximum, le nombre minimum, le nombre moyen, etc, pour que les scientifiques des données puissent mieux comprendre la forme de leurs données.

Enfin, les utilisateurs peuvent avoir accès aux données du jeu de données en appuyant sur le bouton de prévisualisation de la page. Bien entendu, cela n'est possible que si l'utilisateur a accès aux données sous-jacentes.

Comment Amundsen démocratise la découverte de données

Afficher les données pertinentes

Amundsen permet désormais à tous les employés de Lyft, des nouveaux aux plus expérimentés, de devenir autonomes dans leur découverte de données pour leurs tâches quotidiennes.

Parlons technique. L'entrepôt de données de Lyft est sur Hive et toutes les partitions physiques sont stockées sur S3. Les utilisateurs de leurs données s'appuient sur Presto, un moteur de requête en direct, pour la découverte de leurs tables. Pour que son moteur de recherche affiche les tables les plus importantes ou les plus pertinentes pour ses utilisateurs, Lyft utilise le framework DataBuilder pour construire un extracteur d'utilisation de requête qui analyse les journaux de requête pour obtenir des données sur l'utilisation des tables. Ensuite, ils persistent dans cette utilisation de table en tant que document de table Elasticsearch. C'est ainsi qu'ils sont en mesure d'extraire les ensembles de données les plus pertinents pour leurs utilisateurs.

Connecter les données aux personnes

Même si nous aimons clamer à quel point nous sommes techniques et numériques, les processus de recherche de données consistent principalement en des interactions avec des personnes. Et la notion de propriété des données est assez confuse ; cela prend beaucoup de temps si l'on ne sait pas exactement à qui s'adresser.

Amundsen s'attaque à ce problème en créant des relations entre les utilisateurs et leurs données, ce qui permet de partager les connaissances tribales en exposant ces relations.

Lyft a actuellement trois types de relations entre les utilisateurs et les données : suivi, possédé et utilisé. Ces informations aident les employés expérimentés à devenir des ressources utiles pour les autres employés ayant une fonction similaire. M. Amundsen facilite également la recherche des connaissances tribales grâce à un lien vers le profil de chaque utilisateur dans l'annuaire interne des employés.

Ils ont également travaillé à la mise en œuvre d'une fonction de notification qui permettrait aux utilisateurs de demander davantage d'informations aux propriétaires des données, par exemple une description manquante dans un tableau.

Si vous souhaitez obtenir de plus amples informations sur Amundsen, veuillez consulter son site web ici.

L'avenir de Lyft

Lyft espère continuer à travailler avec une communauté grandissante pour améliorer leur expérience de découverte de données et stimuler la productivité des utilisateur . Leur feuille de route comprend actuellement un système de notifications par email, un lignage des données, une refonte de l'interface utilisateur et de l'interface graphique, et bien d'autres choses encore !

La société de covoiturage n'a pas encore dit son dernier mot.

Sources :

Lyft - Statistiques et faits : https://www.statista.com/topics/4919/lyft/
Lyft et son parcours vers le succès : https://www.startupstories.in/stories/lyft-and-its-drive-through-to-success
Statistiques sur les revenus et l'utilisation de Lyft (2019) : https://www.businessofapps.com/data/lyft-statistics/
Presto Infrastructure chez Lyft : https://eng.lyft.com/presto-infrastructure-at-lyft-b10adb9db01?gi=f100fa852946
Open Sourcing Amundsen : A découverte de données And métadonnées Platform :métadonnées
Amundsen - Le moteur de découverte de données et de métadonnées de Lyft :métadonnées

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous couvrons des sujets allant de l'ingestion de données en temps réel à l'analyse pilotée par l'IA. Faites connaissance avec l'équipe dirigeante https://www.actian.com/company/leadership-team/
  • découverte de données
  • métadonnées Management
  • Partager avec Icône Twitter
  • Partager avecLinkedin Icône
  • Partager avec Icône Facebook
  • Partager avec Icône de messagerie

S'abonner au blog d'Actian

Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.

  • Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
  • Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
  • Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.

S'abonner

Cette extension de courriel () n'est pas autorisée. Veuillez mettre à jour.
Ce domaine d'adresses électroniques personnelles () n'est pas autorisé. Veuillez mettre à jour.

Merci de vous être abonné au blog d'Actian !

Préparez-vous à rester informés et inspirés par les dernières idées, tendances et mises à jour dans le monde de l'analyse des données et de la technologie.

Attendez-vous à recevoir bientôt dans votre boîte de réception des articles, des études de cas et des informations sectorielles soigneusement sélectionnés.

À découvrir également :
  • L'intelligence des données pour des décisions plus intelligentes
  • Votre organisation est-elle prête pour la GénAI?
  • Intégration de données flexible

Données + Intelligence IA

  • Actian Data Intelligence Platform
  • Actian Data Observability
  • plateforme de données Actian

Capacités

  • Analyse des données
  • Bases de données
  • Intégration et qualité des données
  • Services d'application

Solutions

  • Industrie manufacturière
  • Services financiers
  • Analyse des données de santé
  • Transport et Logistique
  • Télécommunications

Entreprise

  • À propos d'Actian
  • A propos de HCLSoftware
  • Événements
  • Prix et reconnaissance
  • Salle de presse
  • Presse
  • Carrières
  • Implantations

Clients

  • Support
  • Communauté
  • Documentation
  • Connexion portail client
  • Connexion Actian Data Platform

Commencer

  • Demander une démo
  • Nous contacter
Actian
2025 Actian Corporation. Tous droits réservés.
  • Linkedin
  • GitHub
  • youtube
  • Conditions d'utilisation
  • Politique sur l’esclavage moderne
  • Politique de confidentialité
  • Directives sur les marques
  • Brevets
  • Sécurité
hcl-logo