AWorld: 강력한 GAIA 문제 해결을 위한 안정적인 기동성을 갖춘 동적 다중 에이전트 시스템
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
저자: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
초록
대규모 언어 모델(LLM)의 급속한 발전으로 인해 지능형 에이전트가 복잡한 현실 세계 문제를 해결하기 위해 다양한 외부 도구를 활용할 수 있게 되었습니다. 그러나 에이전트가 여러 도구에 점점 더 의존함에 따라 새로운 과제에 직면하게 되었습니다: 다양한 출처에서 나온 확장된 컨텍스트와 잡음이 섞이거나 관련 없는 도구 출력은 시스템의 신뢰성과 정확성을 저해할 수 있습니다. 이러한 과제들은 에이전트 기반 시스템에서 강화된 안정성의 필요성을 강조합니다. 이를 해결하기 위해 우리는 동적 감독 및 조종 메커니즘을 도입하여 AWorld 프레임워크 내에서 견고하고 동적인 다중 에이전트 시스템(MAS) 아키텍처를 구축했습니다. 우리의 접근 방식에서 실행 에이전트는 중요한 단계에서 가드 에이전트를 호출하여 추론 과정을 검증하고 수정함으로써 잡음으로 인한 오류를 효과적으로 줄이고 문제 해결의 견고성을 강화합니다. GAIA 테스트 데이터셋에 대한 광범위한 실험을 통해 우리의 동적 조종 메커니즘이 솔루션의 효과성과 안정성을 크게 향상시키며, 단일 에이전트 시스템(SAS) 및 표준 도구 보강 시스템을 능가하는 것으로 나타났습니다. 결과적으로, 우리의 동적 MAS 시스템은 권위 있는 GAIA 리더보드에서 오픈소스 프로젝트 중 1위를 차지했습니다. 이러한 발견들은 더 신뢰할 수 있고 신뢰성 있는 지능형 시스템을 개발하는 데 있어 협력적인 에이전트 역할의 실용적 가치를 강조합니다.
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.