Intelligence des données

Le guide de l'exploitation des données par Airbnb

Actian Corporation

19 octobre 2022

Airbnb, une affaire de données

Depuis 2008, Airbnb s'est considérablement développé, avec plus de 6 millions d'annonces et 4 millions d'hôtes dans le monde entier, devenant ainsi une alternative viable aux hôtels.

Avec la collecte de nombreuses informations sur les hôtes, les invités, la durée du séjour, les destinations, etc., Airbnb produit chaque jour des volumes de données colossaux ! Pour pouvoir nettoyer, traiter, gérer et analyser toutes ces données, le leader de l'hébergement a dû mettre en place une culture de la donnée solide et rigide au sein de son organisation.

Dans cet article, découvrez les bonnes pratiques mises en place chez Airbnb pour devenir une entreprise data-driven - le tout basé sur l'intervention de Claire Lebarz, Head of Data Science, au Big Data & AI Paris 2022.

Les 3 niveaux de maturité d'une organisation de données selon Airbnb

Le terme "data-driven" est très connu et couramment utilisé pour décrire une entreprise qui prend des décisions stratégiques basées sur l'analyse et l'interprétation de données. Dans une entreprise véritablement axée sur les données, tous les employés et dirigeants exploitent naturellement les données et les intègrent dans leurs tâches quotidiennes.

Toutefois, selon Claire Lebarz, le terme "axé sur les données" est souvent galvaudé : "Je préfère penser en termes de trois niveaux de maturité qui caractérisent une organisation axée sur les données : Data Busy, Data Informed, Data Powered : Data Busy, Data Informed, Data Powered".

À la page "Données bien remplies"une entreprise a mis en place des personnes centrées sur les données, telles que des analystes de données, des scientifiques de données ou des ingénieurs de données dans l'organisation. Cependant, le temps d'analyse n'est pas assez rapide, ou il n'y a pas de retour sur investissement pour les Data Scientists.

"À ce niveau, il n'y a pas de règles en place concernant la qualité des données, les données ne sont pas fiables. Ou bien elles représentent un goulot d'étranglement pour l'organisation", explique Claire.

Au salon "Informée par les données"l'organisation a mis en place une gouvernance données et les décisions stratégiques sont de plus en plus fondées sur les indicateurs clés de performance et les mesures de l'entreprise plutôt que sur l'instinct de la direction générale.

Enfin, lors de la conférence "Data-Powered", le niveau le plus élevé de la matrice de maturité, les données sont sur la ligne critique de l'organisation et deviennent un moteur essentiel de la croissance de l'entreprise.

"Avant tout, les données ne sont plus réservées à un groupe d'experts en données, mais à l'ensemble de l'organisation - tous les employés optimiser données", explique le responsable de la science des données.

Les 6 étapes pour devenir piloté par les données selon Airbnb

Étape 1 : La méthode scientifique

Dans 'Data Science', il y a avant tout 'Science', explique Claire. La première étape consiste donc à s'approprier la démarche scientifique au sein de l'organisation. "L'idée n'est pas de constituer une grosse équipe de R&D, mais plutôt de mettre sur papier toutes les hypothèses avec lesquelles nous fonctionnons et de trouver les moyens de les valider ou non."

Cette approche implique des tests, des tests et... encore des tests ! Et l'un de ces leviers passe par l'A/B Testing. Le responsable de la science des données explique qu'il était crucial pour Airbnb, lors de la crise COVID-19, de réfléchir à différentes hypothèses sur le monde d'aujourd'hui et celui de demain afin de prendre les bons pivots stratégiques pour l'entreprise.

Un exemple qui souligne l'importance des tests A/B chez Airbnb est la mise en place d'un système de filtrage des prix maximum et minimum sur son site de réservation. En effet, Claire explique que les retours d'expérience des utilisateur étaient meilleurs lorsque les voyageurs pouvaient indiquer leur budget maximum pour réserver un séjour. Sans ce petit ajout, les voyageurs passaient beaucoup de temps sur des annonces moyennes et décidaient de ne pas réserver.

Étape 2 : Alignement de l'équipe stratégique

Pour Claire L., la mise en place d'OKR (Objectives & Key Results) est essentielle pour aligner les différentes équipes en interne. En effet, les équipes de données d'une organisation ont souvent tendance à se concentrer uniquement sur leurs propres indicateurs de données. Pourtant, il est impératif de mettre en place des objectifs communs à l'entreprise pour véritablement insuffler une culture de la donnée dans l'entreprise : "la stratégie doit passer avant les métriques".

Et le leader mondial de la location de courte durée a connu un manque d'alignement. Dans l'exemple ci-dessous, on peut en voir les conséquences négatives sur l'expérience de recherche du site Airbnb en 2017. Dans cette illustration, la requête "los angeles" donnait des résultats dans de multiples catégories sans vraiment faire sens pour l'utilisateur.

Chaque équipe était responsable d'un indicateur de performance clé décorrélé. L'équipe "expérience" était responsable des objectifs de l'entreprise consistant à suggérer des activités à faire dans la ville, tandis qu'une autre équipe était responsable des villes les plus proches de la recherche, etc. Tous les membres de l'équipe étaient chargés de diffuser de multiples informations afin d'accroître leurs propres performances et d'augmenter le trafic vers leur section du site web.

Les utilisateurs se perdaient et finissaient par ne rien réserver parce que les équipes ne tiraient pas dans la même direction.

Étape 3 : Mesurer l'incertitude

Pour Claire L., "l'incertitude est inhérente à la gestion d'une entreprise et à la prise de décisions". Parfois, la meilleure analyse n'équivaut pas à la meilleure décision. Nous devons avoir des discussions au sein de l'organisation, telles que : De quel niveau de confiance avons-nous besoin pour prendre des décisions ? Quels signaux devons-nous prendre en compte pour modifier nos décisions ?

Dans le contexte des OKR, on est souvent tenté d'éviter les initiatives dont le retour sur investissement est difficile à mesurer. Cependant, ce n'est pas parce qu'un indicateur est difficile à mesurer que l'initiative qui en dépend n'est pas la meilleure. Un exemple que nous donne le responsable de la science des données est celui des campagnes de branding menées par Airbnb lors du Super Bowl entre 2017 et 2021.

"Les campagnes de promotion de la marque sont les plus difficiles à mesurer, car il est pratiquement impossible de connaître leur retour sur investissement. Mais au vu de nos résultats indirects, l'élaboration d'une excellente stratégie de marque et l'abandon de la dépendance à l'égard des canaux payants tels que le SEM ont sans doute été la meilleure stratégie de marketing pour stimuler le trafic organique et direct."

Étape 4 : gouvernance centralisée

La gouvernance, selon Claire L., doit être centralisée. En effet, elle a remarqué chez Airbnb que dès que l'on décentralise les équipes de données, et qu'elles rapportent au business, on perd rapidement l'objectivité des données dans l'entreprise. Elle explique : "Les données doivent être considérées comme un bien commun de l'organisation, et il est essentiel de faire des investissements de manière centralisée et au plus haut niveau de l'organisation. Les données doivent être gérées comme un produit dont les employés sont les clients".

En effet, la loi de Conway s'applique également aux données : "Les organisations qui conçoivent des systèmes ont inévitablement tendance à produire des conceptions qui sont des copies de la structure de communication de leur organisation. Appliquée aux données, cette loi fait référence aux différents départements de l'organisation qui créent leurs propres tableaux, analyses et fonctionnalités - sur la base de leurs propres définitions - qui ne sont pas toujours alignés sur ceux des autres départements.

Étape 5 : La bonne communication

Claire L. partage l'une des meilleures décisions prises par Airbnb - celle d'embaucher des Data Scientists qui ne sont pas seulement très bons techniquement, mais aussi bons en communication. En effet, l'entreprise a connu une croissance très rapide en 2017-2018. Et pour se familiariser avec le fonctionnement d'Airbnb, il fallait parfois lire entre 15 et 20 analyses pour les Scientists ou prendre beaucoup de temps pour s'éduquer sur le positionnement de l'entreprise pour les équipes de conception - ce qui pouvait rapidement devenir coûteux.

Airbnb a donc modifié son approche de l'analyse. Au lieu de rédiger des mémos traditionnels qui ont tendance à se périmer avec le temps et doivent être constamment mis à jour, l'entreprise a commencé à construire des "documents vivants". "Nous avons mis en place des "états de connaissance", des agrégations de toutes les connaissances d'une équipe sur un sujet - mises à jour en fonction de la fréquence des recherches sur une question", détaille Claire.

Le responsable de la science des données explique également l'importance de la communication lors de la crise COVID. Les équipes d'Airbnb à San Francisco n'étant plus en face à face, il devenait essentiel de travailler sur de nouveaux formats de communication : "Nous avons observé beaucoup d'emails et de fatigue d'écran en général. Nous avons donc cherché des moyens de communication plus efficaces, comme des formats podcast ou vidéo, afin que nos employés puissent obtenir des informations loin de leurs écrans. Nous devions simplifier et rendre l'information disponible de manière simple et visuelle afin que tous les employés puissent s'approprier les données."

Étape 6 : Un apprentissage automatique plus proche de l'humain

Depuis ses débuts, Airbnb utilise des algorithmes de recherche de correspondance entre les hôtes et les clients. Mais il a fallu du temps à l'entreprise pour les développer en volume, d'une part pour améliorer l'expérience des utilisateur et d'autre part pour aider les équipes interfonctionnelles à se sentir à l'aise pour discuter des décisions de modélisation.

Claire Lebarz explique que pour avoir des algorithmes d'apprentissage automatique sans défauts, il faut prendre le problème à l'envers : "Au lieu de dire que nous devons résoudre un problème par l'automatisation et l'apprentissage automatique, nous voulions nous concentrer sur l'inverse : Quel type d'expérience utilisateur voulons-nous créer ? Et ensuite aller injecter de l'apprentissage automatique là où cela a du sens pour améliorer ces processus."

L'ajout de recherches par catégorie sur la plateforme Airbnb en est l'illustration. En effet, il s'agissait de proposer une autre façon de rechercher un lieu d'hébergement : en demandant au voyageur ce qu'il aimerait faire. "Ici, nous nous éloignons de notre modèle de base où nous proposons d'entrer des dates et l'endroit où vous voulez aller. Maintenant, nous pouvons vous demander ce que vous voulez faire ou avoir, comme des cours de surf, une belle vue sur la plage, ou même une piscine."

Ces algorithmes demandent beaucoup de travail car ils dépendent de la documentation fournie par les hôtes. Pour éviter d'avoir à poser plusieurs questions par semaine aux hébergeurs, c'est l'apprentissage automatique qui "recherche" ces informations et les classe dans les bonnes catégories du site au moyen d'algorithmes.

Conclusion : Les 3 talents pilotés par les données selon Airbnb

Pour garantir une véritable culture des données, il est crucial d'embaucher les bons talents. Selon Claire, voici les trois rôles essentiels d'une entreprise axée sur les données :

  • Ingénieurs en analyse : Ils sont les garants de la gouvernance et de la qualité des données. Ils se positionnent entre l'ingénierie des données et l'analyse pour se concentrer sur les idées et les questions.
  • Machine Learning Ops : Il s'agit d'une nouvelle profession qui se concentre sur le fonctionnement et l'évolution des algorithmes d'apprentissage automatique.
  • Gestionnaires de produits de données : Ce sont eux qui inculquent la manière de gérer les données en tant que produit et qui professionnalisent l'approche des données au sein de l'organisation. Ils assurent la transparence des feuilles de route et des nouvelles fonctionnalités des données et assurent la liaison avec les autres fonctions.

Il est essentiel d'intégrer ces trois professions émergentes dans l'organisation pour qu'elle devienne réellement "Data Powered".

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.