Blog | IA et apprentissage automatique | | 13 min de lecture

Développement d'un agent d'analyse approfondie pour informatique décisionnelle en situation réelle

Développement d'un agent d'analyse approfondie pour des applications concrètes

Résumé

  • informatique décisionnelle basée sur l'IA informatique décisionnelle au-delà de la conversion de texte en SQL en permettant une analyse itérative des données en plusieurs étapes.
  • La conception multi-agents améliore la qualité de l'analyse grâce à la clarification, la planification, le langage SQL, les graphiques et la création de rapports.
  • Les notes structurées et le suivi de l'avancement aident l'IA à garder le fil conducteur lors de flux de travail analytiques longs et complexes.
  • L'expertise humaine reste indispensable pour la validation, la prise en compte du contexte commercial et la transformation des tendances en décisions.

informatique décisionnelle un problème. Malgré des décennies d'investissement dans outils bi, l'analyse des données d'entreprise suit encore, pour l'essentiel, le même schéma : une personne a une question d'ordre opérationnel, elle la pose à un analyste de données, celui-ci passe des jours à rédiger des requêtes SQL et à créer des tableaux de bord, pour finalement produire un rapport. Si l'analyse initiale soulève de nouvelles questions – ce qui est presque toujours le cas –, le cycle recommence.

Par ailleurs, on a constaté des progrès remarquables dans le domaine des systèmes d'IA capables de mener des recherches et des analyses de manière autonome. Les agents Deep Research d'OpenAI peuvent étudier des sujets complexes en élaborant des stratégies de recherche en plusieurs étapes, en recueillant des informations provenant de sources diverses et en synthétisant des rapports exhaustifs. Gemini de Google et d'autres systèmes offrent Fonctionnalités similaires Fonctionnalités les tâches de recherche sur le Web.

Mais voici ce qui fait défaut : aucune de ces avancées n’a véritablement modifié la manière dont les entreprises analysent leurs données internes – les transactions clients, les registres de stocks, les indicateurs de vente et les données opérationnelles stockées dans leurs entrepôts de données. Les systèmes Text-to-SQL peuvent générer des requêtes, mais ils ne sont pas capables de mener le type d'analyse itérative et fondée sur des hypothèses que data analysts expérimentés. Ils ne peuvent pas poser de questions de clarification, adapter leur approche en fonction des premiers résultats, ni fournir le contexte métier qui rend l'analyse exploitable.

Nous avons développé AI Analyst pour combler cette lacune, en intégrant les Fonctionnalités de recherche autonome Fonctionnalités retrouve dans les systèmes d'IA en ligne à informatique décisionnelle d'entreprise.

Alors que la communauté de l'IA au sens large désigne ces systèmes sous le nom d'agents de « recherche approfondie », nous utilisons le terme « analyse approfondie » pour souligner que nous mettons l'accent sur l'analyse des données plutôt que sur la collecte d'informations

Les défis liés à l'application de l'IA générale aux données d'entreprise réelles

Les systèmes traditionnels de conversion de texte en SQL ont réalisé des progrès impressionnants lors des tests de performance universitaires, certains modèles atteignant une précision d'exécution supérieure à 90 % sur jeux de données standardisés. Ces résultats s'accompagnent toutefois d'une réserve importante : ils fonctionnent dans des environnements simplifiés qui ne reflètent guère les scénarios réels rencontrés en entreprise.

Les benchmarks universitaires se caractérisent généralement par des schémas de petite taille (environ 50 colonnes par base de données), l'utilisation d'un seul dialecte SQL (généralement SQLite), support limitée des types de données et des requêtes simples comptant en moyenne seulement 30 tokens. En revanche, les entrepôts de données d'entreprise posent des défis qui remettent totalement en cause ces hypothèses :

  • Les bases de données de production contiennent souvent plus de 500 colonnes réparties sur des centaines de tables.
  • Les entreprises utilisent divers dialectes SQL (BigQuery, Snowflake, Redshift) dotés de fonctionnalités propres à chaque plateforme.
  • Pour bien comprendre, il faut disposer de connaissances métier, de définitions commerciales et d'un contexte organisationnel qui vont bien au-delà des schémas de tables.
  • Les véritables problèmes professionnels nécessitent une analyse en plusieurs étapes, la formulation d'hypothèses et un affinement itératif.
  • L'écart entre les avancées théoriques et déploiement en entreprise déploiement , car la conception informatique décisionnelle efficaces informatique décisionnelle nécessite de repenser en profondeur la manière dont les systèmes d'IA abordent le travail d'analyse, au-delà de la simple génération de requêtes SQL.

Notre approche

Nous avons développé ce que nous appelons un « agent d'analyse approfondie » pour informatique décisionnelle. Le principe est simple : au lieu de se contenter de générer des requêtes SQL, nous avons voulu créer un système d'IA capable de gérer l'ensemble workflow analytique workflow un analyste de données humain suivrait.

Cela signifie que l'agent ne devait pas se contenter de simplement requête . Il doit créer des visualisations, gérer plusieurs pistes d'analyse en parallèle et synthétiser les résultats dans des rapports cohérents. Lorsqu'ils examinent une question métier, les analystes expérimentés explorent souvent plusieurs hypothèses simultanément : ils exécutent différentes requêtes, créent divers graphiques et examinent plusieurs angles avant de tirer des conclusions. Nous voulions que notre agent fonctionne de la même manière, en utilisant l'exécution parallèle des outils pour examiner simultanément plusieurs aspects d'un problème plutôt que de suivre un seul chemin linéaire.

Choix architecturaux

Nous avons rapidement compris qu'un seul modèle de grande envergure ne pouvait pas gérer efficacement tous les différents aspects du processus d'analyse. Nous avons donc mis au point un système multi-agents dans lequel chaque composant a une fonction spécifique :

Architecture du système AI Analyst

Cela s'est avéré bien plus efficace que d'essayer de tout intégrer dans agents IA seul agents IA.‍

L'architecture du système peut être représentée sous la forme d'une composition hiérarchique multi-agents :

Agent d'analyse approfondie : Ψ = Orchestrator(I, C, P, Composer, R)

Où chaque composante est un agents IA indépendant ( agents IA responsabilités spécifiques :

Intent Router: I(q) → {route, confidence} – An agent that classifies incoming queries and routes them to appropriate handlers.

Clarifier Agent: C(q, catalog) → {questions, context} – An autonomous agent that searches the data catalog to understand available data and business definitions, then generates clarification questions only when needed, such as asking about preferred metrics, time periods, or business definitions.

Planning Agent: P(q, clarifications) → objectives = {o₁, o₂, …, oₙ} – An agent that creates a high-level research strategy where each objective extends beyond the literal question to provide comprehensive business value.

Agent Composer : Composer(objectifs, contexte) → artefacts – Moteur analytique central doté d'un raisonnement itératif et d'une exécution parallèle des outils. Fonctionnalités.

Agent de création de rapports : R(artefacts, contexte) → comprehensive_report – Un agent autonome qui synthétise tous les artefacts produits par le Composer en rapports analytiques cohérents et axés sur l'activité.

Each tool interaction updates both the analytical state and the artifact store A:A = {SQL results, charts, notepads, catalog data, progress tracking}

Le système assure la persistance des données grâce à la gestion des artefacts, ce qui permet de mener des analyses complexes en s'appuyant sur les travaux antérieurs, tout en garantissant la conservation automatique des principaux résultats pour les parties prenantes de l'entreprise.

Intent Router : La première passerelle

Avant de se plonger dans l'architecture de Deep Analysis Agent, il est utile de comprendre comment les requêtes sont acheminées. Notre routeur d'intentions est un système distinct qui classe les requêtes entrantes en différentes catégories, telles que l'exploration de données, les requêtes d'analyse spécifiques, les explications de résultats et les demandes d'informations sur le système.‍

Le rôle de l'Intent Router est simple : déterminer si une requête nécessite une analyse de données ou tout autre traitement. S'il s'agit d'une requête d'analyse, celle-ci est transmise à l'agent d'analyse approprié (Quick ou Deep).‍

Suivant : L'agent d'analyse approfondie

Lorsque l'Intent Router identifie une demande d'analyse et la transfère vers le mode Deep Analysis, c'est là que la véritable orchestration commence. L'agent Deep Analysis est un système multi-agents sophistiqué conçu pour traiter des questions métier complexes et multidimensionnelles, dont l'examen complet peut prendre entre 15 et 20 minutes.

L'agent de clarification : formulation intelligente des questions

Discussion sur Wobby

Les utilisateurs professionnels posent souvent des questions vagues telles que « Comment se portent nos magasins ? », sans se rendre compte des nombreuses interprétations possibles. L'agent Clarifier résout ce problème en choisissant judicieusement le moment où il demande des précisions.

Agent de clarification AI Analyst

L'agent de clarification commence par analyser le catalogue de données cerner les modèles de données disponibles, les définitions métier et les indicateurs existants. Ce n'est que lorsqu'il identifie une véritable ambiguïté ou un manque de contexte métier qu'il génère des questions de clarification. Pour une requête concernant les performances d'un magasin, il peut poser des questions sur des indicateurs spécifiques (chiffre d'affaires au mètre carré par rapport à la rotation des stocks), la zone géographique ou les périodes concernées – mais uniquement si le catalogue ne contient pas déjà de préférences organisationnelles claires pour ces choix.

L'agent fait la distinction entre les questions techniques (quelles tables contiennent les données du magasin, comment calculer les indicateurs), qu'il résout de manière autonome à l'aide d'une recherche dans le catalogue, et les questions métier (quels indicateurs sont les plus importants, quelles périodes sont pertinentes), qui nécessitent utilisateur . Cela évite de submerger les parties prenantes métier de détails techniques tout en garantissant que l'analyse reflète bien l'intention métier.

Trouver le juste équilibre s'est avéré difficile. Au départ, l'agent posait trop de questions techniques auxquelles les utilisateurs non initiés ne pouvaient pas répondre – par exemple : « Dois-je utiliser la table customer_transactions ou la vue sales_summary ? » Les utilisateurs métier n'avaient aucun moyen d'y répondre de manière pertinente. À l'inverse, poser trop peu de questions conduisait à des analyses qui ne tenaient pas compte du contexte métier essentiel.

Nous avons passé des semaines à mettre au point l'Agent de clarification afin qu'il puisse déterminer quand les informations du catalogue sont suffisantes et quand une clarification humaine est réellement nécessaire pour les termes métier, les définitions ou les préférences analytiques.

L'agent de planification : planification de l'analyse

Une fois que utilisateur nous a fourni des précisions, nous devons transformer sa demande métier en un véritable plan d'analyse. C'est là que nous essayons d'aller au-delà d'une interprétation littérale de la question.

Si quelqu’un nous interroge sur les performances des magasins dans le Nord-Est par rapport à celles de la Côte Ouest, nous ne nous contentons pas de comparer directement ces deux régions. Le chargé de planification réfléchit aux éléments contextuels supplémentaires qui pourraient s’avérer utiles – tendances saisonnières, types de magasins, évolution des stocks – et les intègre dans le programme de recherche. L’objectif est d’anticiper les questions complémentaires que utilisateur se poser après avoir pris connaissance des premiers résultats.‍

Nous limitons cela à 3 ou 5 objectifs généraux afin de rester concentrés, mais chaque objectif est conçu pour permettre d'acquérir une compréhension globale de la problématique métier.

L'agent Composer : agent d'analyse principal (SQL + graphiques)

L'agent Composer fonctionne selon une boucle ReACT adaptative impliquant une interaction humaine conditionnelle. Il est capable d'exécuter des requêtes SQL, d'extraire et d'interpréter métadonnées catalogue de données, de générer des graphiques et des visualisations, et d'affiner son analyse de manière itérative en fonction des résultats obtenus.

Améliorer la capacité de concentration de l'agent

L'une de nos principales innovations est le « système de bloc-notes » destiné à préserver le contexte de l'analyse, dans lequel l'agent gère des documents structurés comprenant une liste de contrôle principale pour le suivi des livrables et de l'avancement, les conclusions classées par domaine de recherche, ainsi que les découvertes intermédiaires et les observations relatives à la qualité des données.

Avant la mise en place du système de bloc-notes, nos agents « oubliaient » souvent les conclusions précédentes et refaisaient le travail d'analyse. Les longues sessions se soldaient par une baisse de qualité, l'agent perdant le fil de ce qui avait déjà été découvert. Le bloc-notes structuré a permis d'éliminer cette perte de contexte, les agents parvenant désormais à maintenir des fils d'analyse cohérents, même après de nombreuses itérations.‍

C'est le changement de comportement induit par le bloc-notes qui a constitué l'amélioration la plus notable. Lorsque nous avons programmé l'agent pour qu'il lise explicitement ses notes avant de prendre des décisions, la qualité de l'analyse s'est améliorée. L'agent a alors commencé à repérer les contradictions dans ses propres conclusions, à identifier les lacunes de son enquête et à établir des liens plus réfléchis entre les données.‍

Cette capacité d'autoréflexion permet naturellement à l'agent d'adapter son plan d'analyse de manière dynamique à mesure que de nouvelles informations apparaissent. Bien que l'agent commence par un plan linéaire (domaine de recherche A → B → C), il peut s'adapter en fonction de ses découvertes :

« `notepad

Plan initial :
[A] Analyse des recettes (livrables A1, A2, A3)
[B] Analyse des coûts (livrables B1, B2)
[C] Calcul du retour sur investissement (livrable C1)

Après A1 Discovery :
[A] Analyse des recettes (✓ A1, A2, A3)
[C] Calcul du retour sur investissement (✓ C1) // Déplacé vers le haut en raison de la dépendance vis-à-vis de A1
[B] Analyse des coûts (B1, B2)

Cette flexibilité est essentielle pour une véritable analyse commerciale, où les premiers résultats modifient souvent l'orientation de l'enquête.

L'agent examine systématiquement la structure des tables et métadonnées des colonnes métadonnées exécuter des requêtes, garantissant ainsi que les analyses reposent sur une compréhension solide des données. Plutôt que de se contenter d'extraire des données, il formule des hypothèses sur les tendances et les relations, puis conçoit des analyses pour tester ces hypothèses de manière itérative.

L'agent Report Writer

La dernière étape fait appel à un agent spécialisé dans la rédaction de rapports, qui synthétise tous les éléments d'analyse en un rapport prêt à l'emploi. Cet agent doit relever un défi particulier : traduire les conclusions techniques en informations exploitables pour l'entreprise, sans pour autant déformer ni surinterpréter les données.

À l'instar de Composer, Report Writer fonctionne selon un workflow itératif, en regroupant tous les éléments accumulés au sein d'un document métier cohérent qui traduit les conclusions techniques en informations exploitables pour les parties prenantes.

L'une des innovations dont nous sommes particulièrement fiers est notre système de rapports interactifs, qui permet à l'agent Embarquer . Plutôt que de générer des fichiers PDF statiques ou des résumés au format texte brut, nous avons créé un format Markdown enrichi qui allie une analyse narrative à des éléments interactifs.

Nos rapports combinent plusieurs types de contenu :

  • Texte descriptif qui présente les résultats dans un langage commercial simple.
  • Des graphiques interactifs que les utilisateurs peuvent explorer, filtrer et analyser en détail.
  • Des tableaux de données pouvant être triés, consultés et exportés au format CSV.
  • Des infobulles contextuelles qui fournissent des détails méthodologiques sans alourdir le texte principal.
  • Nous avons mis au point une syntaxe Markdown personnalisée qui permet cela.

Défis

La mise au point de l'agent « Report Writer » s'est avérée plus complexe que prévu. Apprendre à l'agent à déterminer ce qui est « suffisamment intéressant » pour figurer dans un rapport a nécessité de nombreuses itérations. Au départ, l'agent qualifiait de « significative » la moindre variation en pourcentage, générant ainsi des rapports encombrés de fluctuations mineures au lieu de se concentrer sur des informations pertinentes pour l'entreprise. De par leur nature, les grands modèles linguistiques (LLM) ont tendance à adopter un style dramatique, verbeux et fleuri, ce qui ne convient guère aux rapports d'entreprise, où les parties prenantes ont besoin d'informations claires et concises. Nous avons passé des mois à concevoir des prompts pour l'agent afin qu'il puisse distinguer le bruit statistique des tendances commerciales significatives, tout en conservant un langage mesuré et approprié.

La flexibilité des modèles a posé un autre défi. Plutôt que d'imposer à chaque analyse une structure de rapport statique, nous avions besoin que l'agent adapte le format de son rapport en fonction du type d'analyse et du public visé. Une analyse des tendances financières nécessite des sections et des priorités différentes de celles d'une étude sur l'efficacité opérationnelle ou d'une analyse de segmentation de la clientèle.‍

Outils supplémentaires spécifiques aux rapports

Nous avons également doté le générateur de rapports d'outils supplémentaires, notamment d'une fonction de calculatrice. Les grands modèles linguistiques (LLM) ont du mal à effectuer des calculs mathématiques en plusieurs étapes, ce qui entraîne souvent des erreurs subtiles lorsqu'ils calculent des pourcentages, des taux de croissance ou des mesures statistiques en une seule fois. Grâce à ces outils de calcul dédiés, l'agent peut vérifier l'exactitude mathématique de ses rapports plutôt que de se fier à un raisonnement arithmétique potentiellement erroné.

Suivi des progrès et transparence

Les utilisateurs ont besoin d'une visibilité sur les processus analytiques de longue durée. Notre outil de suivi de progression fournit des mises à jour en temps réel en surveillant les schémas d'activité des agents et en traduisant les actions techniques en indicateurs de progression compréhensibles pour les utilisateurs. Cela comble une lacune majeure des systèmes existants, dans lesquels les utilisateurs n'ont aucune insight les flux de travail analytiques complexes.

Résultats des tests bêta

Nos tests bêta menés auprès de nos clients nous ont permis de mieux cerner tant le potentiel que les limites actuelles de notre produit.

Un client du secteur de la vente au détail a utilisé notre agent d’analyse approfondie pour étudier l’optimisation des stocks au sein de son réseau de magasins. Alors que le mode d’analyse rapide existant de Wobby permettait d’identifier les niveaux de stock de base et les taux de rotation, l’analyse approfondie a fourni un contexte supplémentaire. L’agent a relevé des tendances saisonnières différentes entre les zones touristiques et les sites de banlieue, bien que la validation ait montré que certaines tendances nécessitaient un contexte commercial pour être interprétées correctement. L'analyse a mis en évidence des liens potentiels entre les activités promotionnelles dans différentes catégories de produits, nécessitant une étude plus approfondie pour confirmer leur pertinence commerciale. Le système a identifié des indicateurs statistiques pour les situations de surstockage et de sous-stockage, bien que la mise en œuvre ait nécessité un jugement humain concernant les seuils commerciaux.

L'analyse, qui nécessitait habituellement 2 à 3 jours de travail d'un analyste, a été réalisée en une dizaine de minutes. Nous avons toutefois constaté que l'expertise humaine reste indispensable pour la validation du domaine, la mise en perspective stratégique et la planification de la mise en œuvre. Les analystes métier doivent toujours vérifier si les tendances identifiées ont un sens sur le plan commercial. L'agent est capable d'identifier des corrélations, mais le jugement humain est essentiel pour déterminer les liens de causalité et les implications commerciales. Si l'agent peut suggérer les éléments à analyser, la traduction de ces informations en processus métier exploitables nécessite l'expertise humaine.

Dans un autre cas, le PDG d’une plateforme de colocation a fait part d’une préoccupation particulière : « Je soupçonne que des colocataires potentiels sont rejetés en raison de leur âge. Par exemple, si un participant a 45 ans et que la moyenne d’âge du foyer est de 25 ans, je constate qu’il y a une certaine discrimination, le participant étant rejeté par vote. Je voudrais donc que vous analysiez la fréquence de ce phénomène, c’est-à-dire les cas où de nouveaux participants sont rejetés par vote en raison de leur âge. »

Ce type d'analyse aurait normalement pris plusieurs jours à leur équipe — pour autant qu'elle ait été réalisable, compte tenu des autres priorités. L'agent d'analyse approfondie a pu examiner les tendances de vote, tenir compte de facteurs tels que la localisation et le revenu, et identifier d'éventuels schémas de discrimination liés à l'âge. Cependant, l'agent a également signalé de manière appropriée les cas où il avait besoin d'une intervention humaine concernant les règles métier, les seuils de vote et la manière d'interpréter les cas limites dans les données.‍

Les défis actuels et les perspectives d'avenir

Si les agents d'analyse approfondie destinés à informatique décisionnelle prometteurs, plusieurs défis subsistent.

L'efficacité de l'agent dépend directement de catalogue de données et de l'exactitude catalogue de données . Des informations de catalogue incomplètes ou obsolètes peuvent conduire à des orientations d'analyse sous-optimales. Certaines règles métier et exceptions spécifiques à un domaine sont difficiles à déduire automatiquement par l'agent, ce qui nécessite une supervision et une validation humaines continues. Bien que l'agent excelle dans l'identification de modèles, la distinction entre corrélation et causalité, ou la compréhension du contexte métier sous-jacent aux relations statistiques, il a souvent besoin de l'expertise humaine. Les scénarios d'entreprise complexes présentant des modèles de données inhabituels ou des exigences métier particulières nécessitent parfois une intervention et un affinement manuels.

L'avenir de informatique décisionnelle une collaboration entre Fonctionnalités de l'IA Fonctionnalités insight humaine. Les agents IA sont capables de gérer la complexité informatique et l'ampleur des environnements de données d'entreprise modernes, tandis que les analystes humains apportent leur expertise sectorielle, leur sens du contexte stratégique et leur jugement commercial, qui restent indispensables pour obtenir des informations exploitables.‍

Pour les équipes chargées des données qui envisagent de recourir à l'analyse augmentée par l'IA, la combinaison de Fonctionnalités d'analyse approfondie Fonctionnalités d'un contexte basé sur un catalogue offre une voie pratique à suivre, qui renforce Fonctionnalités d'analyse humaine Fonctionnalités tenant compte de la complexité et des nuances de prise de décision en entreprise.