ChatPaper.aiChatPaper

AWorld : Système multi-agent dynamique avec manœuvre stable pour une résolution robuste des problèmes GAIA

AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving

August 13, 2025
papers.authors: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI

papers.abstract

L'évolution rapide des grands modèles de langage (LLMs) a permis aux agents intelligents d'exploiter divers outils externes pour résoudre des problèmes complexes du monde réel. Cependant, à mesure que les agents dépendent de plus en plus de multiples outils, ils rencontrent de nouveaux défis : des contextes étendus provenant de sources disparates ainsi que des sorties d'outils bruyantes ou non pertinentes peuvent compromettre la fiabilité et la précision du système. Ces défis soulignent la nécessité d'une stabilité accrue dans les systèmes basés sur des agents. Pour y remédier, nous introduisons des mécanismes de supervision dynamique et de manœuvre, construisant ainsi une architecture robuste et dynamique de système multi-agents (MAS) dans le cadre AWorld. Dans notre approche, l'Agent d'Exécution invoque l'Agent de Garde à des étapes critiques pour vérifier et corriger le processus de raisonnement, réduisant efficacement les erreurs dues au bruit et renforçant la robustesse de la résolution de problèmes. Des expériences approfondies sur le jeu de données de test GAIA révèlent que notre mécanisme de manœuvre dynamique améliore significativement à la fois l'efficacité et la stabilité des solutions, surpassant les systèmes mono-agent (SAS) et les systèmes standard augmentés d'outils. En conséquence, notre système MAS dynamique a atteint la première place parmi les projets open-source sur le prestigieux classement GAIA. Ces résultats mettent en lumière la valeur pratique des rôles collaboratifs des agents dans le développement de systèmes intelligents plus fiables et dignes de confiance.
English
The rapid advancement of large language models (LLMs) has empowered intelligent agents to leverage diverse external tools for solving complex real-world problems. However, as agents increasingly depend on multiple tools, they encounter new challenges: extended contexts from disparate sources and noisy or irrelevant tool outputs can undermine system reliability and accuracy. These challenges underscore the necessity for enhanced stability in agent-based systems. To address this, we introduce dynamic supervision and maneuvering mechanisms, constructing a robust and dynamic Multi-Agent System (MAS) architecture within the AWorld framework. In our approach, the Execution Agent invokes the Guard Agent at critical steps to verify and correct the reasoning process, effectively reducing errors arising from noise and bolstering problem-solving robustness. Extensive experiments on the GAIA test dataset reveal that our dynamic maneuvering mechanism significantly improves both the effectiveness and stability of solutions, outperforming single-agent system (SAS) and standard tool-augmented systems. As a result, our dynamic MAS system achieved first place among open-source projects on the prestigious GAIA leaderboard. These findings highlight the practical value of collaborative agent roles in developing more reliable and trustworthy intelligent systems.
PDF222August 14, 2025