AWorld: ロバストなGAIA問題解決のための安定な機動性を備えた動的マルチエージェントシステム
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
著者: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
要旨
大規模言語モデル(LLM)の急速な進化により、インテリジェントエージェントは複雑な現実世界の問題を解決するために多様な外部ツールを活用できるようになりました。しかし、エージェントが複数のツールに依存するにつれて、新たな課題が生じています。異なるソースからの拡張されたコンテキストや、ノイズや無関係なツール出力は、システムの信頼性と精度を損なう可能性があります。これらの課題は、エージェントベースのシステムにおける安定性の向上の必要性を浮き彫りにしています。これを解決するために、我々は動的な監視と操作メカニズムを導入し、AWorldフレームワーク内で堅牢で動的なマルチエージェントシステム(MAS)アーキテクチャを構築しました。我々のアプローチでは、実行エージェントが重要なステップでガードエージェントを呼び出し、推論プロセスを検証および修正することで、ノイズに起因するエラーを効果的に削減し、問題解決の堅牢性を強化します。GAIAテストデータセットでの広範な実験により、我々の動的操作メカニズムが、単一エージェントシステム(SAS)や標準的なツール拡張システムを上回り、ソリューションの有効性と安定性を大幅に向上させることが明らかになりました。その結果、我々の動的MASシステムは、権威あるGAIAリーダーボードでオープンソースプロジェクトの中で首位を獲得しました。これらの発見は、より信頼性の高いインテリジェントシステムを開発する上で、協調的なエージェントの役割の実用的な価値を強調しています。
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.