Intelligence des données

Air France : Leur stratégie Big Data dans un contexte de Cloud hybride

Actian Corporation

22 octobre 2020

airfrance big data

Air France-KLM est le premier groupe en termes de trafic international au départ de l'Europe. La compagnie est membre de l'alliance SkyTeam, composée de 19 compagnies aériennes différentes, offrant l'accès à un réseau mondial de plus de 14 500 vols quotidiens dans plus de 1 150 destinations dans le monde. En 2019, Air France représentait :

  • 104,2 millions de passagers.
  • 312 destinations.
  • 119 pays.
  • 546 avions.
  • 15 millions de membres inscrits à leur programme de fidélité "Flying Blue "*.
  • 2 300 vols par jour*.

Lors de la conférence Big Data Paris 2020, Eric Poutrin, Lead Enterprise Architect gestion des données & Analytics chez Air France, a expliqué le fonctionnement de la compagnie aérienne, la structure Big Data d'Air France au départ, et l'architecture de données actuelle dans le contexte d'une structure cloud hybride.

Comment fonctionne une compagnie aérienne ?

Avant de parler de données, il est impératif de comprendre le fonctionnement d'une compagnie aérienne, de la création de sa trajectoire de vol jusqu'à son atterrissage. 

Avant de planifier un itinéraire, la première étape pour une compagnie aérienne comme Air France est de disposer d'un programme de vols. A noter qu'en période de crise sanitaire, ils sont susceptibles de changer assez fréquemment. Une fois le programme de vols établi, trois flux totalement distincts s'activent pour qu'un vol ait une date et une heure de départ données :

  • Le flux de passagers, qui représente différentes formes de services visant à faciliter l'expérience du voyageur tout au long de son parcours, de l'achat de billets sur leurs différentes plateformes (web, app, physique) à la mise à disposition de personnel ou de kiosques automatiques dans différents aéroports pour aider les voyageurs à s'enregistrer, à déposer leurs bagages, etc.
  • Le flux de gestion de l'équipage, avec des profils adaptés aux qualifications requises pour exploiter ou piloter l'avion, ainsi que la gestion des horaires des hôtesses et des stewards.
  • Le flux d'ingénierie flux d'ingénierie qui consiste à amener le bon avion avec la bonne configuration au bon point de stationnement.

Cependant, Eric nous dit que tout cela... est dans un monde idéal :

"Le "produit" d'une compagnie aérienne passe par le client, de sorte que tous les risques sont visibles. De plus, ils ont tous un impact sur les flux des uns et des autres ! Plus la date du vol se rapproche, plus ces risques deviennent critiques.

Suite à ces constats, il y a maintenant 25 ans, Air France a décidé de mettre en place une architecture "orientée services", qui permet, entre autres, de notifier les abonnés en cas d'aléas sur n'importe quel flux. Ces notifications en temps réel sont poussées soit vers les agents, soit vers les passagers en fonction de leurs besoins : prévention des difficultés techniques (panne d'un avion), aléas climatiques, prévention des retards, etc.

"L'objectif était de combler le fossé entre une approche analytique traditionnelle et une approche analytique moderne basée sur l'analyse omniprésente, prédictive et prescriptive à grande échelle", affirme Eric.

Le voyage Big Data d'Air France

La chronologie

En 1998, Air France a commencé sa stratégie de données en mettant en place un entrepôt de données d'entreprise sur le plan commercial, rassemblant des données sur les clients, les équipages et les aspects techniques, qui ont permis aux équipes informatiques de la compagnie d'élaborer des rapports d'analyse. 

Eric nous raconte qu'en 2001, suite à la crise sanitaire du SRAS (Syndrome Respiratoire Aigu Sévère), Air France a dû redéployer ses avions suite à l'interdiction des vols entrants vers les Etats-Unis. C'est l'entrepôt de données de l'entreprise qui lui a permis de trouver d'autres sources de revenus, grâce à ses algorithmes de machine learning et d'intelligence artificielle. Cette façon de travailler avec les données a bien fonctionné pendant 10 ans et a même permis à l'entreprise de surmonter plusieurs autres difficultés, dont la tragédie du 11 septembre 2001 et la crise de la hausse des prix du pétrole.

En 2012, les équipes data d'Air France ont décidé de mettre en place une plateforme Hadoop afin de pouvoir réaliser des analyses prédictives ou prescriptives (selon les besoins de chacun) en en temps réel, l'entrepôt de données ne répondant plus à ces nouveaux besoins et au volume important d'informations à gérer. Ce n'est que quelques mois après l'implémentation de Hadoop, KAFKA et d'autres technologies de nouvelle génération que l'entreprise a pu obtenir des données beaucoup plus "fraîches" et pertinentes.

Depuis lors, les équipes ont constamment amélioré et optimisé leur écosystème de données afin de rester à la pointe des nouvelles technologies et ainsi permettre aux utilisateurs de données de travailler efficacement avec leur analyse.

Les défis d'Air France en matière de données

Au cours de la conférence, Eric a également présenté les défis de l'entreprise en matière de données dans le cadre de la mise en œuvre d'une stratégie de données :

  • Fournir un écosystème analytique fiable avec des données de qualité.
  • Mettre en œuvre des technologies adaptées à tous les profils et à leurs cas d'utilisation, quel que soit leur secteur d'activité.
  • Disposer d'une infrastructure qui supporte tous les types de données en en temps réel.

Air France a pu résoudre une partie de ces problèmes avec la mise en place d'une architecture robuste (qui a notamment permis de résister à la crise COVID-19), ainsi que la mise en place d'équipes dédiées, le déploiement 'applications et de structures de sécurité, notamment au regard de la GDPR et d'autres réglementations pilotes. 

Cependant, Air France KLM n'a pas fini de travailler pour relever ses défis en matière de données. Avec des volumes de données en constante augmentation, le nombre de données et d'utilisateurs professionnels croissant, la gestion des flux de données à travers les différents canaux de l'entreprise et la gestion des données est un travail constant de gouvernance:

"Nous devons toujours être au service de l'entreprise, et comme les gens et les tendances changent, il est impératif de faire des efforts continus pour s'assurer que tout le monde peut comprendre les données".

L'architecture unifiée des données d'Air France

L'architecture unifiée des données (UDA) est la pierre angulaire d'Air France. Eric explique qu'il existe quatre types de plateformes:

La plate-forme de découverte de données

Séparées en deux plateformes différentes, elles sont les applications de choix pour les data scientists et les citizen data scientists. Elles permettent, entre autres, de :

    • Extraire la "connaissance" des données.
    • Traiter des données non structurées (texte, images, voix, etc.).
    • analyse prédictive support analyse prédictive pour comprendre les comportements des clients.

Un lac de données

Le lac de données d'Air France est une instance logique et est accessible à tous les employés de l'entreprise, quel que soit leur métier. Eric précise toutefois que les données sont bien sécurisées : "Le data lake n'est pas du tout un open bar ! Tout se fait sous le contrôle des data officers et des data owners". Le lac de données :

    • Stocke des données structurées et non structurées.
    • Combine les différentes sources de données provenant de diverses entreprises.
    • Fournit une vue complète d'une situation, d'un sujet ou d'un environnement de données.
    • Est très évolutif.

"en temps réel Data Processing" plateformes

Pour exploiter les données, Air France a mis en place 8 plateformes traitement des données en temps réel afin de répondre aux besoins de chaque cas d'usage"hautement prioritaire". Par exemple, ils ont une plateforme pour la maintenance prédictive, la connaissance du comportement des clients, ou l'optimisation des processus sur les escales.

Eric confirme que lorsqu'un événement ou un danger se produit, leur plateforme est capable de transmettre des recommandations "en temps réel" en seulement 10 secondes.

Entrepôts de données

Comme mentionné plus haut, Air France avait également déjà mis en place des entrepôts de données pour stocker des données externes telles que les données des clients et des partenaires et les données des systèmes opérationnels. Ces entrepôts de données permettent aux utilisateurs d'requête ces ensembles de données en toute sécurité et constituent un excellent vecteur de communication pour expliquer la stratégie en matière de données entre les différents métiers de l'entreprise.

Les avantages de la mise en œuvre d'une architecture cloud hybride

Les questions initiales d'Air France concernant le passage au Cloud étaient les suivantes :

  • Air France KLM s'efforce de normaliser autant que possible ses services de calcul et de stockage.
  • Toutes les données ne sont pas autorisées à quitter les locaux d'Air France en raison de réglementations ou de données sensibles.
  • Tous les outils déjà utilisés dans les plateformes UDA sont disponibles à la fois sur site et dans le nuage public.

Éric estime qu'une architecture hybride en nuage permettrait à l'entreprise d'avoir plus de flexibilité pour répondre aux défis actuels :

"Le fait de placer notre UDA sur le Cloud public offrirait une plus grande flexibilité à l'entreprise et plus d'options en termes de déploiement données.

Selon Air France, voici la liste des meilleures pratiques à suivre avant de migrer vers un nuage hybride :

  • Vérifiez si les données ont une bonne raison d'être migrées vers le nuage public.
  • Vérifier le niveau de sensibilité des données (conformément aux politiques internes de gestion des données ).
  • Vérifier la conformité avec les lignes directrices de mise en œuvre de l'UDA.
  • Vérifier les conceptions de flux de données.
  • Configurer la bonne connexion réseau.
  • Pour chaque outil de mise en œuvre, choisissez le bon niveau de gestion des services.
  • Pour chaque composant, évaluer le niveau de verrouillage et les conditions de sortie.
  • Contrôler et prévoir les coûts éventuels.
  • Adopter un modèle de sécurité qui permette à la sécurité du nuage hybride d'être aussi transparente que possible.
  • Étendre la gouvernance données dans le nuage.

Où est Air France aujourd'hui ?

Il est clair que la crise du COVID-19 a complètement bouleversé le secteur aérien. Chaque jour, Air France doit prendre le temps de comprendre les nouveaux comportements des passagers et d'adapter les programmes de vols en en temps réel, en fonction des restrictions de voyage mises en place par les différents gouvernements. A la fin de l'été 2020, Air France aura desservi près de 170 destinations, soit 85% de son réseau régulier.

L'architecture de données d'Air France a donc été un catalyseur essentiel pour le redressement de ses compagnies aériennes :

" Un grand merci à nos utilisateurs métiers (data scientists) qui tentent chaque jour d'optimiser les services en en temps réel afin de comprendre le comportement des passagers en pleine crise sanitaire. Même si nous travaillons sur l'intelligence artificielle, le facteur humain reste une ressource essentielle dans la réussite d'une stratégie de données". 

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.