Blog | IA y aprendizaje automático | | 13 min de lectura

Creación de un agente de análisis profundo para la inteligencia empresarial en el mundo real

Creación de un agente de análisis profundo para aplicaciones del mundo real

Summary

  • La inteligencia empresarial basada en la IA va más allá de la conversión de texto a SQL, ya que permite realizar análisis de datos iterativos y de varios pasos.
  • El diseño multiagente mejora la calidad del análisis mediante la clarificación, la planificación, el lenguaje SQL, los gráficos y la elaboración de informes.
  • Las notas estructuradas y el seguimiento del progreso ayudan a la IA a mantener el contexto durante flujos de trabajo analíticos largos y complejos.
  • La experiencia humana sigue siendo fundamental para la validación, el contexto empresarial y la conversión de patrones en decisiones.

La inteligencia empresarial tiene un problema. A pesar de décadas de inversión en herramientas de BI, la mayor parte del análisis de datos en las empresas sigue el mismo patrón básico: alguien tiene una duda sobre el negocio, se la plantea a un analista de datos, el analista pasa días escribiendo consultas SQL y creando paneles de control, y finalmente elabora un informe. Si el análisis inicial plantea nuevas preguntas —lo cual ocurre casi siempre—, el ciclo se repite.

Por otra parte, se han producido avances notables en los sistemas de IA capaces de llevar a cabo investigaciones y análisis de forma autónoma. Los agentes Deep Research de OpenAI pueden investigar temas complejos mediante la planificación de estrategias de investigación en varias fases, la recopilación de información de diversas fuentes y la elaboración de informes exhaustivos. Gemini, de Google, y otros sistemas demuestran capacidades similares para tareas de investigación en la web.

Pero hay algo que falta: ninguno de estos avances ha cambiado de forma significativa la forma en que las empresas analizan sus datos internos —las transacciones de los clientes, los registros de inventario, las métricas de ventas y los datos operativos almacenados en sus almacenes de datos—. Los sistemas de texto a SQL pueden generar consultas, pero no pueden llevar a cabo el tipo de análisis iterativo y basado en hipótesis que realizan los analistas de datos experimentados. No pueden formular preguntas aclaratorias, adaptar su enfoque en función de los resultados iniciales ni proporcionar el contexto empresarial que hace que el análisis sea aplicable.

Hemos creado AI Analyst para salvar esta brecha, llevando las capacidades de investigación autónoma que vemos en los sistemas de IA basados en la web al ámbito de la inteligencia empresarial.

Aunque la comunidad general de la inteligencia artificial se refiere a estos sistemas como agentes de «investigación profunda», nosotros utilizamos el término «análisis profundo» para destacar que nos centramos en el análisis de datos más que en la recopilación de información

Los retos de aplicar la IA general a datos empresariales reales

Los sistemas tradicionales de conversión de texto a SQL han logrado avances impresionantes en las pruebas de rendimiento académicas, y algunos modelos alcanzan una precisión de ejecución superior al 90 % en conjuntos de datos estandarizados. Sin embargo, estos logros vienen acompañados de una salvedad importante: funcionan en entornos simplificados que se parecen muy poco a los escenarios empresariales del mundo real.

Los casos de prueba académicos suelen caracterizarse por esquemas reducidos (alrededor de 50 columnas por base de datos), un único dialecto SQL (normalmente SQLite), compatibilidad limitada con tipos de datos y consultas sencillas con una media de tan solo 30 tokens. Por el contrario, los almacenes de datos empresariales plantean retos que rompen por completo con estas premisas:

  • Las bases de datos de producción suelen contener más de 500 columnas repartidas en cientos de tablas.
  • Las organizaciones utilizan diversos dialectos de SQL (BigQuery, Snowflake, Redshift) con características específicas de cada plataforma.
  • Para comprenderlo, se necesitan conocimientos del ámbito, definiciones empresariales y un contexto organizativo que va mucho más allá de los esquemas de las tablas.
  • Las cuestiones empresariales reales requieren un análisis en varias etapas, la formulación de hipótesis y un proceso de perfeccionamiento iterativo.
  • La brecha entre el éxito académico y la aplicación en el ámbito empresarial se ha mantenido porque la creación de herramientas de inteligencia empresarial eficaces exige replantearse por completo la forma en que los sistemas de inteligencia artificial abordan el trabajo analítico, más allá de la simple generación de consultas SQL.

Nuestro enfoque

Hemos creado lo que denominamos un «agente de análisis en profundidad» para la inteligencia empresarial. La idea central es sencilla: en lugar de limitarnos a generar consultas SQL, queríamos crear un sistema de inteligencia artificial capaz de gestionar todo el flujo de trabajo analítico que seguiría un analista de datos humano.

Esto significa que el agente debía hacer algo más que limitarse a consultar datos. Debe crear visualizaciones, gestionar múltiples vías de análisis en paralelo y sintetizar los resultados en informes coherentes. Al investigar una cuestión empresarial, los analistas experimentados suelen barajar varias hipótesis al mismo tiempo: ejecutan diferentes consultas, crean diversos gráficos y exploran múltiples ángulos antes de sacar conclusiones. Queríamos que nuestro agente funcionara de la misma manera, utilizando la ejecución paralela de herramientas para investigar múltiples aspectos de un problema al mismo tiempo, en lugar de seguir una única vía lineal.

Decisiones de arquitectura

Pronto nos dimos cuenta de que un único modelo de gran envergadura no podía gestionar de forma eficaz todos los aspectos del flujo de análisis. En su lugar, creamos un sistema multiagente en el que cada componente tiene una función específica:

Arquitectura del sistema AI Analyst

Esto resultó ser mucho más eficaz que intentar meterlo todo en un único agente de IA.‍

La arquitectura del sistema puede representarse como una composición jerárquica de múltiples agentes:

Agente de análisis profundo: Ψ = Orquestador(I, C, P, Compositor, R)

En el que cada componente es un agente de IA independiente con responsabilidades específicas:

Intent Router: I(q) → {route, confidence} – An agent that classifies incoming queries and routes them to appropriate handlers.

Clarifier Agent: C(q, catalog) → {questions, context} – An autonomous agent that searches the data catalog to understand available data and business definitions, then generates clarification questions only when needed, such as asking about preferred metrics, time periods, or business definitions.

Planning Agent: P(q, clarifications) → objectives = {o₁, o₂, …, oₙ} – An agent that creates a high-level research strategy where each objective extends beyond the literal question to provide comprehensive business value.

Agente Composer: Composer(objetivos, contexto) → artefactos – El motor analítico central con capacidades de razonamiento iterativo y ejecución paralela de herramientas.

Agente generador de informes: R(artefactos, contexto) → informe_completo – Un agente independiente que sintetiza todos los artefactos generados por el Compositor en informes analíticos coherentes y orientados al negocio.

Each tool interaction updates both the analytical state and the artifact store A:A = {SQL results, charts, notepads, catalog data, progress tracking}

El sistema mantiene la memoria persistente mediante la gestión de artefactos, lo que permite que los análisis complejos se basen en trabajos anteriores, con la conservación automática de los resultados clave para las partes interesadas de la empresa.

Intent Router: La primera puerta

Antes de profundizar en la arquitectura del Deep Analysis Agent, conviene entender cómo se enrutan las solicitudes en primer lugar. Nuestro Intent Router es un sistema independiente que clasifica las solicitudes entrantes en categorías como exploración de datos, solicitudes de análisis específicas, explicaciones de resultados y consultas sobre el sistema.‍

La función del enrutador de intenciones es sencilla: determinar si una solicitud requiere un análisis de datos o algo totalmente distinto. Si se trata de una solicitud de análisis, se transfiere al agente de análisis correspondiente (Quick o Deep).‍

Siguiente: El agente de análisis profundo real

Cuando el enrutador de intenciones identifica una solicitud de análisis y la deriva al modo de análisis en profundidad, es entonces cuando comienza la verdadera coordinación. El agente de análisis en profundidad es un sofisticado sistema multiagente diseñado para gestionar cuestiones empresariales complejas y multifacéticas cuya investigación completa puede llevar entre 15 y 20 minutos.

El agente clarificador: formulación inteligente de preguntas

Charla sobre Wobby

Los usuarios empresariales suelen formular preguntas imprecisas como «¿Cómo están funcionando nuestras tiendas?», sin darse cuenta de las múltiples formas en que se puede interpretar esa pregunta. El Clarifier Agent resuelve este problema seleccionando cuidadosamente cuándo solicitar una aclaración.

Agente clarificador de AI Analyst

El agente de aclaración busca primero en el catálogo de datos para comprender los patrones de datos disponibles, las definiciones empresariales y las métricas existentes. Solo cuando identifica una ambigüedad real o una falta de contexto empresarial genera preguntas de aclaración. En el caso de una consulta sobre el rendimiento de una tienda, podría preguntar sobre métricas específicas (ingresos por metro cuadrado frente a rotación de inventario), el ámbito geográfico o los periodos de tiempo, pero solo si el catálogo no contiene ya preferencias organizativas claras respecto a estas opciones.

El agente distingue entre cuestiones técnicas (qué tablas contienen datos de la tienda, cómo calcular las métricas), que resuelve de forma autónoma mediante la búsqueda en el catálogo, y cuestiones de negocio (qué métricas son más importantes, qué periodos de tiempo son relevantes), que requieren la intervención del usuario. De este modo, se evita abrumar a las partes interesadas del negocio con detalles técnicos, al tiempo que se garantiza que el análisis refleje la intención empresarial adecuada.

Encontrar el equilibrio adecuado resultó ser todo un reto. Al principio, el agente hacía demasiadas preguntas técnicas que los usuarios sin conocimientos técnicos no podían responder, como por ejemplo: «¿Debería utilizar la tabla customer_transactions o la vista sales_summary?». Los usuarios de negocios no tenían forma de responder a estas preguntas de manera significativa. Por otro lado, hacer muy pocas preguntas daba lugar a análisis que pasaban por alto un contexto empresarial crucial.

Dedicamos varias semanas a desarrollar rápidamente el Clarifier Agent para que distinguiera cuándo la información del catálogo es suficiente y cuándo se necesita realmente una aclaración humana en lo que respecta a términos empresariales, definiciones o preferencias analíticas.

El agente de planificación: Planificación del análisis

Una vez que hayamos obtenido una aclaración del usuario, debemos convertir su consulta empresarial en un plan de análisis concreto. Es aquí donde intentamos ir más allá de limitararnos a interpretar la pregunta al pie de la letra.

Si alguien pregunta por el rendimiento de las tiendas en el noreste en comparación con la costa oeste, no nos limitamos a comparar esas regiones directamente. El responsable de planificación reflexiona sobre qué contexto adicional podría resultar útil —patrones estacionales, tipos de tiendas, dinámica de inventario— y lo incorpora al plan de investigación. El objetivo es anticipar qué preguntas de seguimiento podría plantear el usuario tras ver los resultados iniciales.‍

Lo limitamos a entre tres y cinco objetivos generales para mantener el enfoque, pero cada uno de ellos está pensado para contribuir a una comprensión global de la cuestión empresarial.

El agente Composer: agente de análisis principal (SQL + gráficos)

El agente Composer funciona mediante un bucle ReACT adaptativo con interacción humana condicional. El agente puede ejecutar consultas SQL, recuperar e interpretar metadatos del catálogo de datos, generar gráficos y visualizaciones, y perfeccionar su análisis de forma iterativa en función de los resultados obtenidos.

Mejorar la capacidad de concentración del agente

Una de nuestras innovaciones clave es el «sistema de bloc de notas» para mantener el contexto del análisis, en el que el agente gestiona documentos estructurados que incluyen una lista de verificación maestra para los resultados esperados y el seguimiento del progreso, conclusiones organizadas por área de investigación, así como hallazgos provisionales y observaciones sobre la calidad de los datos.

Antes de implementar el sistema de bloc de notas, nuestros agentes solían «olvidarse» con frecuencia de los hallazgos anteriores y repetían el trabajo de análisis. Las sesiones prolongadas se veían afectadas, ya que el agente perdía la pista de lo que ya se había descubierto. El bloc de notas estructurado eliminó esta pérdida de contexto, y ahora los agentes mantienen hilos de análisis coherentes incluso tras numerosas iteraciones.‍

La mejora más significativa se debió al cambio de comportamiento que provocó el bloc de notas. Cuando programamos al agente para que leyera explícitamente sus notas antes de tomar decisiones, la calidad del análisis mejoró. El agente empezó a detectar contradicciones en sus propios hallazgos, a identificar lagunas en su investigación y a establecer conexiones más reflexivas entre los datos.‍

Esta capacidad de autorreflexión se traduce naturalmente en la capacidad del agente para adaptar el plan de análisis de forma dinámica a medida que surgen nuevos datos. Aunque el agente parte de un plan lineal (Área de investigación A → B → C), puede adaptarse en función de los descubrimientos:

«`bloc de notas

Plan inicial:
[A] Análisis de ingresos (Entregables A1, A2, A3)
[B] Análisis de costes (Entregables B1, B2)
[C] Cálculo del retorno de la inversión (Entregable C1)

Tras el descubrimiento de A1:
[A] Análisis de ingresos (✓ A1, A2, A3)
[C] Cálculo del ROI (✓ C1) // Se ha adelantado debido a la dependencia de A1
[B] Análisis de costes (B1, B2)

Esta flexibilidad es fundamental para el análisis empresarial real, en el que los primeros resultados suelen cambiar el rumbo de la investigación.

El agente inspecciona sistemáticamente las estructuras de las tablas y los metadatos de las columnas antes de ejecutar las consultas, lo que garantiza que los análisis se basen en un conocimiento sólido de los datos. En lugar de limitarse a extraer datos, formula hipótesis sobre patrones y relaciones, y luego diseña análisis para comprobar dichas hipótesis de forma iterativa.

El agente del generador de informes

La etapa final cuenta con un agente especializado en la elaboración de informes que sintetiza todos los resultados del análisis en un informe listo para su uso empresarial. Este agente se enfrenta a un reto singular: traducir los hallazgos técnicos en información empresarial útil sin caer en interpretaciones erróneas ni exagerar los datos.

Al igual que Composer, Report Writer funciona mediante un flujo de trabajo iterativo, consolidando todos los elementos acumulados en un documento empresarial coherente que traduce los hallazgos técnicos en información útil para las partes interesadas.

Una innovación de la que nos sentimos especialmente orgullosos es nuestro sistema de informes interactivos, en el que el agente puede incluir elementos multimedia. En lugar de generar archivos PDF estáticos o resúmenes de texto sin formato, hemos creado un formato Markdown enriquecido que combina el análisis narrativo con elementos interactivos.

Nuestros informes combinan varios tipos de contenido:

  • Texto narrativo que explica los resultados en un lenguaje empresarial sencillo.
  • Gráficos interactivos que los usuarios pueden explorar, filtrar y analizar en profundidad.
  • Tablas de datos que se pueden ordenar, buscar y exportar como archivos CSV.
  • Informaciones contextuales que ofrecen detalles sobre la metodología sin entorpecer la lectura del texto principal.
  • Hemos desarrollado una sintaxis Markdown personalizada que lo hace posible.

Desafíos

El desarrollo del agente del generador de informes resultó más complicado de lo previsto. Enseñar al agente qué se considera «lo suficientemente interesante» como para incluirlo en un informe requirió numerosas iteraciones. Al principio, el agente marcaba como «significativo» cualquier pequeño cambio porcentual, lo que daba lugar a informes repletos de fluctuaciones insignificantes en lugar de centrarse en información relevante para el negocio. Por su propia naturaleza, los modelos de lenguaje grande (LLM) tienden a ser dramáticos, prolijos y floridos en su lenguaje, lo que no resulta adecuado para los informes empresariales, donde las partes interesadas necesitan información clara y concisa. Dedicamos meses a diseñar las indicaciones para que el agente distinguiera entre el ruido estadístico y los patrones empresariales significativos, manteniendo al mismo tiempo un lenguaje adecuadamente mesurado.

La flexibilidad de las plantillas planteaba otra dificultad. En lugar de encasillar todos los análisis en una estructura de informe estática, necesitábamos que el agente adaptara el formato de los informes en función del tipo de análisis y del público destinatario. Un análisis de tendencias financieras requiere secciones y aspectos destacados distintos a los de un estudio de eficiencia operativa o un análisis de segmentación de clientes.‍

Herramientas adicionales específicas para los informes

Además, hemos dotado al Report Writer de herramientas adicionales, entre las que se incluye una función de calculadora. Los modelos de lenguaje grande (LLM) tienen dificultades con los cálculos matemáticos de varios pasos y, a menudo, cometen errores sutiles al calcular porcentajes, tasas de crecimiento o medidas estadísticas en una sola pasada. Al proporcionar herramientas de cálculo específicas, el agente puede verificar la exactitud matemática de sus informes en lugar de basarse en un razonamiento aritmético que podría ser erróneo.

Seguimiento de los avances y transparencia

Los usuarios necesitan tener una visión clara de los procesos analíticos de larga duración. Nuestro Progress Tracker ofrece actualizaciones en tiempo real mediante el seguimiento de los patrones de actividad de los agentes y la traducción de las acciones técnicas en indicadores de progreso fáciles de interpretar para el negocio. Esto subsana una carencia fundamental de los sistemas actuales, en los que los usuarios carecen de información sobre los complejos flujos de trabajo analíticos.

Resultados de la prueba beta

Las pruebas beta que hemos realizado con los clientes nos han proporcionado información valiosa tanto sobre el potencial como sobre las limitaciones actuales de nuestro producto.

Un cliente del sector minorista utilizó nuestro «Deep Analysis Agent» para estudiar la optimización de inventario en toda su red de tiendas. Si bien el modo de análisis rápido ya existente de Wobby permitía identificar los niveles básicos de existencias y las tasas de rotación, el análisis en profundidad aportó un contexto adicional. El agente detectó diferentes patrones estacionales entre las zonas turísticas y las ubicaciones suburbanas, aunque la validación reveló que algunos patrones requerían un contexto empresarial para interpretarse correctamente. El análisis señaló posibles conexiones entre la actividad promocional en diferentes categorías de productos, lo que requirió una investigación más profunda para confirmar su relevancia empresarial. El sistema identificó indicadores estadísticos de situaciones de exceso y falta de existencias, aunque su implementación requirió el criterio humano para establecer los umbrales empresariales.

El análisis, que normalmente requería entre dos y tres días de trabajo de los analistas, se completó en unos 10 minutos. Sin embargo, hemos aprendido que la experiencia humana sigue siendo fundamental para la validación del ámbito, el contexto estratégico y la planificación de la implementación. Los analistas de negocios siguen teniendo que validar si los patrones detectados tienen sentido desde el punto de vista empresarial. El agente puede identificar correlaciones, pero el criterio humano es esencial para determinar la causalidad y las implicaciones empresariales. Aunque el agente puede sugerir qué analizar, la traducción de los conocimientos obtenidos en procesos empresariales aplicables requiere la experiencia humana.

En otro caso, el director general de una plataforma de alojamiento compartido planteó una preocupación concreta: «Tengo la sospecha de que se rechaza a posibles nuevos compañeros de piso por su edad. Por ejemplo, si un participante tiene 45 años y la edad media de la comunidad es de 25 años, veo que se produce cierta discriminación cuando el participante es rechazado mediante votación. Por eso quiero que analices con qué frecuencia ocurre esto, es decir, que los nuevos participantes sean rechazados mediante votación por motivos de edad».

Normalmente, a su equipo le habría llevado varios días completar este tipo de análisis —si es que hubiera sido factible, dadas las prioridades concurrentes—. El Deep Analysis Agent fue capaz de examinar los patrones de voto, tener en cuenta factores como la ubicación y los ingresos, e identificar posibles patrones de discriminación por motivos de edad. Sin embargo, el agente también señaló adecuadamente cuándo necesitaba la intervención humana en lo relativo a las reglas de negocio, los umbrales de voto y cómo interpretar los casos extremos en los datos.‍

Retos actuales y perspectivas de futuro

Aunque los agentes de Deep Analysis para la inteligencia empresarial se muestran prometedores, aún quedan varios retos por superar.

La eficacia del agente está directamente relacionada con la exhaustividad y la precisión del catálogo de datos. Una información del catálogo incompleta u obsoleta puede dar lugar a direcciones de análisis subóptimas. Algunas reglas de negocio y excepciones específicas del ámbito son difíciles de deducir automáticamente para el agente, lo que requiere una orientación y validación humanas continuas. Aunque el agente destaca en la identificación de patrones, la distinción entre correlación y causalidad o la comprensión del contexto empresarial que subyace a las relaciones estadísticas, a menudo requiere la experiencia humana. Los escenarios empresariales complejos con patrones de datos inusuales o requisitos de negocio a veces requieren intervención y ajuste manuales.

El futuro de la inteligencia empresarial pasa por la colaboración entre las capacidades de la inteligencia artificial y la perspicacia humana. Los agentes de inteligencia artificial pueden gestionar la complejidad computacional y la magnitud de los entornos de datos empresariales actuales, mientras que los analistas humanos aportan los conocimientos especializados, el contexto estratégico y el criterio empresarial que siguen siendo esenciales para obtener información útil.‍

Para los equipos de datos que estén considerando la analítica potenciada por IA, la combinación de capacidades de investigación en profundidad con un contexto basado en catálogos ofrece una vía práctica a seguir, que potencia las capacidades analíticas humanas al tiempo que respeta las complejidades y los matices de la toma de decisiones empresarial real.