Databook : Comment Uber transforme les données en connaissances exploitables Avec les métadonnées
Actian Corporation
17 février 2020

Uber est l'une des entreprises les plus fascinantes de la dernière décennie. Fondée en 2009, Uber est devenue l'une des l'une des startups les plus valorisées au monde.. En fait, il existe même un terme pour décrire leur succès : "uberisation"qui désigne le fait de modifier le marché d'un service en introduisant une nouvelle façon de l'acheter ou de l'utiliser, notamment grâce à la technologie mobile.
Des services de transport peer-to-peer aux commandes de restaurants, il est clair que la plateforme d'Uber est axée sur les données. Les données sont au cœur du marché mondial d'Uber, créant de meilleures expériences d'utilisateur travers leurs services pour leurs clients, et permettant à leurs employés d'être plus efficaces dans leur travail.
Cependant, le Big Data en lui-même n'était pas suffisant ; la quantité de données générées par Uber nécessite un contexte pour prendre des décisions commerciales. C'est pourquoi, à l'instar de nombreuses autres entreprises unicorn, comme Airbnb avec son portail de données, l' équipe d'ingénieurs d'Uber a créé Databook. Cette plateforme interne vise à scanner, collecter et agréger les métadonnées pour voir plus clairement la localisation des données dans le SI d'Uber et leurs référents. En bref, une plateforme qui veut transformer des données brutes en données contextualisées.
Comment l'activité (et les données) d'Uber se sont développées
Depuis 2016, Uber a ajouté de nouveaux secteurs d'activité à sa plateforme, notamment Uber Eats et Jump Bikes. Voici quelques statistiques sur Uber :
- 15 millions de voyages par jour.
- Plus de 75 millions d'usagers actifs.
- 18 000 employés depuis sa création en 2009.
L'entreprise s'est développée, tout comme ses données et ses métadonnées. Pour s'assurer que ses données et ses analyses puissent suivre le rythme rapide de sa croissance, elle avait besoin d'un système plus puissant pour découvrir ses ensembles de données pertinents. C'est ainsi qu'est né Databook et son système de curation des métadonnées ..
L'avènement du Databook
La plateforme Databook gère de riches métadonnées sur les ensembles de données d'Uber et permet aux employés de l'entreprise d'explorer, de découvrir et d'utiliser efficacement leurs données. La plateforme veille également à ce que le contexte de leurs données ne soit pas perdu parmi les centaines de milliers de personnes qui tentent de les analyser. En résumé, les métadonnées de Databook permettent à tous les ingénieurs, scientifiques des données et équipes informatiques de passer de la simple visualisation de leurs données à leur transformation en connaissances exploitables.
Databook permet aux employés d'exploiter des métadonnées automatisées afin de collecter une grande variété de métadonnées fréquemment mises à jour. Pour les rendre accessibles et consultables, Databook offre à ses consommateurs une interface utilisateur avec un moteur de recherche Google ou son API RESTful.
Architecture du livre de données
L'architecture de Databook se décompose en trois parties : comment les métadonnées sont collectées, stockées, et comment les données sont mises en valeur.
Sur le plan conceptuel, l'architecture du Databook a été conçue pour permettre quatre capacités clés:
- Extensibilité : Il est facile d'ajouter de nouvelles métadonnées, de nouveaux espaces de stockage et de nouvelles entités.
- Accessibilité : Les services peuvent accéder à toutes les métadonnées de manière programmatique.
- évolutivité: Support besoins des utilisateur professionnels et à la nouveauté technologique.
- Exécution : Puissance et vitesse.
Pour en savoir plus sur l'architecture de Databook, veuillez consulter leur article https://eng.uber.com/databook/.
Quelles sont les prochaines étapes pour Databook ?
Avec Databook, les métadonnées chez Uber sont plus utiles que jamais.
Mais ils espèrent encore développer d'autres fonctionnalités telles que la capacité de générer des informations sur les données à l'aide de modèles d'apprentissage automatique et de créer des mécanismes avancés de détection, de prévention et d'atténuation des problèmes.
Sources d'information
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.