ChatPaper.aiChatPaper

AWorld: Sistema Multiagente Dinámico con Maniobras Estables para la Resolución Robusta de Problemas GAIA

AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving

August 13, 2025
Autores: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI

Resumen

El rápido avance de los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) ha permitido a los agentes inteligentes aprovechar diversas herramientas externas para resolver problemas complejos del mundo real. Sin embargo, a medida que los agentes dependen cada vez más de múltiples herramientas, se enfrentan a nuevos desafíos: contextos extendidos provenientes de fuentes dispares y salidas de herramientas ruidosas o irrelevantes pueden socavar la confiabilidad y precisión del sistema. Estos desafíos subrayan la necesidad de una mayor estabilidad en los sistemas basados en agentes. Para abordar esto, introducimos mecanismos dinámicos de supervisión y maniobra, construyendo una arquitectura robusta y dinámica de Sistema Multi-Agente (MAS, por sus siglas en inglés) dentro del marco AWorld. En nuestro enfoque, el Agente de Ejecución invoca al Agente de Guardia en pasos críticos para verificar y corregir el proceso de razonamiento, reduciendo efectivamente los errores derivados del ruido y fortaleciendo la robustez en la resolución de problemas. Experimentos exhaustivos en el conjunto de pruebas GAIA revelan que nuestro mecanismo dinámico de maniobra mejora significativamente tanto la efectividad como la estabilidad de las soluciones, superando a los sistemas de agente único (SAS, por sus siglas en inglés) y a los sistemas estándar aumentados con herramientas. Como resultado, nuestro sistema dinámico MAS alcanzó el primer lugar entre los proyectos de código abierto en el prestigioso ranking GAIA. Estos hallazgos resaltan el valor práctico de los roles colaborativos de los agentes en el desarrollo de sistemas inteligentes más confiables y dignos de confianza.
English
The rapid advancement of large language models (LLMs) has empowered intelligent agents to leverage diverse external tools for solving complex real-world problems. However, as agents increasingly depend on multiple tools, they encounter new challenges: extended contexts from disparate sources and noisy or irrelevant tool outputs can undermine system reliability and accuracy. These challenges underscore the necessity for enhanced stability in agent-based systems. To address this, we introduce dynamic supervision and maneuvering mechanisms, constructing a robust and dynamic Multi-Agent System (MAS) architecture within the AWorld framework. In our approach, the Execution Agent invokes the Guard Agent at critical steps to verify and correct the reasoning process, effectively reducing errors arising from noise and bolstering problem-solving robustness. Extensive experiments on the GAIA test dataset reveal that our dynamic maneuvering mechanism significantly improves both the effectiveness and stability of solutions, outperforming single-agent system (SAS) and standard tool-augmented systems. As a result, our dynamic MAS system achieved first place among open-source projects on the prestigious GAIA leaderboard. These findings highlight the practical value of collaborative agent roles in developing more reliable and trustworthy intelligent systems.
PDF222August 14, 2025