ChatPaper.aiChatPaper

AWorld: Sistema Multiagente Dinâmico com Manobra Estável para Resolução Robusta de Problemas GAIA

AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving

August 13, 2025
Autores: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI

Resumo

O rápido avanço dos grandes modelos de linguagem (LLMs) capacitou agentes inteligentes a utilizar diversas ferramentas externas para resolver problemas complexos do mundo real. No entanto, à medida que os agentes dependem cada vez mais de múltiplas ferramentas, eles enfrentam novos desafios: contextos estendidos provenientes de fontes distintas e saídas de ferramentas ruidosas ou irrelevantes podem comprometer a confiabilidade e a precisão do sistema. Esses desafios ressaltam a necessidade de maior estabilidade em sistemas baseados em agentes. Para abordar isso, introduzimos mecanismos dinâmicos de supervisão e manobra, construindo uma arquitetura robusta e dinâmica de Sistema Multi-Agente (MAS) dentro do framework AWorld. Em nossa abordagem, o Agente de Execução invoca o Agente de Guarda em etapas críticas para verificar e corrigir o processo de raciocínio, reduzindo efetivamente erros decorrentes de ruído e fortalecendo a robustez na resolução de problemas. Experimentos extensivos no conjunto de testes GAIA revelam que nosso mecanismo dinâmico de manobra melhora significativamente tanto a eficácia quanto a estabilidade das soluções, superando sistemas de agente único (SAS) e sistemas padrão aumentados por ferramentas. Como resultado, nosso sistema dinâmico MAS alcançou o primeiro lugar entre os projetos de código aberto no prestigiado ranking GAIA. Esses achados destacam o valor prático de papéis colaborativos de agentes no desenvolvimento de sistemas inteligentes mais confiáveis e seguros.
English
The rapid advancement of large language models (LLMs) has empowered intelligent agents to leverage diverse external tools for solving complex real-world problems. However, as agents increasingly depend on multiple tools, they encounter new challenges: extended contexts from disparate sources and noisy or irrelevant tool outputs can undermine system reliability and accuracy. These challenges underscore the necessity for enhanced stability in agent-based systems. To address this, we introduce dynamic supervision and maneuvering mechanisms, constructing a robust and dynamic Multi-Agent System (MAS) architecture within the AWorld framework. In our approach, the Execution Agent invokes the Guard Agent at critical steps to verify and correct the reasoning process, effectively reducing errors arising from noise and bolstering problem-solving robustness. Extensive experiments on the GAIA test dataset reveal that our dynamic maneuvering mechanism significantly improves both the effectiveness and stability of solutions, outperforming single-agent system (SAS) and standard tool-augmented systems. As a result, our dynamic MAS system achieved first place among open-source projects on the prestigious GAIA leaderboard. These findings highlight the practical value of collaborative agent roles in developing more reliable and trustworthy intelligent systems.
PDF322August 14, 2025