Intelligence des données

Databook : Comment Uber transforme les données en connaissances exploitables Avec les métadonnées

Actian Corporation

17 février 2020

uber-databook-cover

Uber est l'une des entreprises les plus fascinantes de la dernière décennie. Fondée en 2009, Uber est devenue l'une des l'une des startups les plus valorisées au monde.. En fait, il existe même un terme pour décrire leur succès : "uberisation"qui désigne le fait de modifier le marché d'un service en introduisant une nouvelle façon de l'acheter ou de l'utiliser, notamment grâce à la technologie mobile.

Des services de transport peer-to-peer aux commandes de restaurants, il est clair que la plateforme d'Uber est axée sur les données. Les données sont au cœur du marché mondial d'Uber, créant de meilleures expériences d'utilisateur travers leurs services pour leurs clients, et permettant à leurs employés d'être plus efficaces dans leur travail.

Cependant, le Big Data en lui-même n'était pas suffisant ; la quantité de données générées par Uber nécessite un contexte pour prendre des décisions commerciales. C'est pourquoi, à l'instar de nombreuses autres entreprises unicorn, comme Airbnb avec son portail de données, l' équipe d'ingénieurs d'Uber a créé Databook. Cette plateforme interne vise à scanner, collecter et agréger les métadonnées pour voir plus clairement la localisation des données dans le SI d'Uber et leurs référents. En bref, une plateforme qui veut transformer des données brutes en données contextualisées.

Comment l'activité (et les données) d'Uber se sont développées

Depuis 2016, Uber a ajouté de nouveaux secteurs d'activité à sa plateforme, notamment Uber Eats et Jump Bikes. Voici quelques statistiques sur Uber :

  • 15 millions de voyages par jour.
  • Plus de 75 millions d'usagers actifs.
  • 18 000 employés depuis sa création en 2009.

L'entreprise s'est développée, tout comme ses données et ses métadonnées. Pour s'assurer que ses données et ses analyses puissent suivre le rythme rapide de sa croissance, elle avait besoin d'un système plus puissant pour découvrir ses ensembles de données pertinents. C'est ainsi qu'est né Databook et son système de curation des métadonnées ..

L'avènement du Databook

La plateforme Databook gère de riches métadonnées sur les ensembles de données d'Uber et permet aux employés de l'entreprise d'explorer, de découvrir et d'utiliser efficacement leurs données. La plateforme veille également à ce que le contexte de leurs données ne soit pas perdu parmi les centaines de milliers de personnes qui tentent de les analyser. En résumé, les métadonnées de Databook permettent à tous les ingénieurs, scientifiques des données et équipes informatiques de passer de la simple visualisation de leurs données à leur transformation en connaissances exploitables.

Databook permet aux employés d'exploiter des métadonnées automatisées afin de collecter une grande variété de métadonnées fréquemment mises à jour. Pour les rendre accessibles et consultables, Databook offre à ses consommateurs une interface utilisateur avec un moteur de recherche Google ou son API RESTful.

Architecture du livre de données

L'architecture de Databook se décompose en trois parties : comment les métadonnées sont collectées, stockées, et comment les données sont mises en valeur.

Sur le plan conceptuel, l'architecture du Databook a été conçue pour permettre quatre capacités clés:

  • Extensibilité : Il est facile d'ajouter de nouvelles métadonnées, de nouveaux espaces de stockage et de nouvelles entités.
  • Accessibilité : Les services peuvent accéder à toutes les métadonnées de manière programmatique.
  • évolutivité: Support besoins des utilisateur professionnels et à la nouveauté technologique.
  • Exécution : Puissance et vitesse.

Pour en savoir plus sur l'architecture de Databook, veuillez consulter leur article https://eng.uber.com/databook/.

Quelles sont les prochaines étapes pour Databook ?

Avec Databook, les métadonnées chez Uber sont plus utiles que jamais.

Mais ils espèrent encore développer d'autres fonctionnalités telles que la capacité de générer des informations sur les données à l'aide de modèles d'apprentissage automatique et de créer des mécanismes avancés de détection, de prévention et d'atténuation des problèmes.

Sources d'information

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous couvrons des sujets allant de l'ingestion de données en temps réel à l'analyse pilotée par l'IA.