AWorld: Dynamisches Multi-Agenten-System mit stabiler Manövrierfähigkeit für robuste GAIA-Problembewältigung
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
papers.authors: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
papers.abstract
Die rasante Weiterentwicklung großer Sprachmodelle (LLMs) hat intelligente Agenten befähigt, diverse externe Werkzeuge zur Lösung komplexer realer Probleme zu nutzen. Da Agenten jedoch zunehmend auf mehrere Werkzeuge angewiesen sind, sehen sie sich neuen Herausforderungen gegenüber: erweiterte Kontexte aus unterschiedlichen Quellen sowie verrauschte oder irrelevante Werkzeugausgaben können die Zuverlässigkeit und Genauigkeit des Systems beeinträchtigen. Diese Herausforderungen unterstreichen die Notwendigkeit einer verbesserten Stabilität in agentenbasierten Systemen. Um dies zu adressieren, führen wir dynamische Überwachungs- und Steuerungsmechanismen ein und konstruieren eine robuste und dynamische Multi-Agenten-System (MAS)-Architektur innerhalb des AWorld-Frameworks. In unserem Ansatz ruft der Ausführungsagent den Wächteragenten in kritischen Schritten auf, um den Denkprozess zu überprüfen und zu korrigieren, wodurch effektiv Fehler durch Rauschen reduziert und die Problemlösungsrobustheit gestärkt wird. Umfangreiche Experimente mit dem GAIA-Testdatensatz zeigen, dass unser dynamischer Steuerungsmechanismus sowohl die Effektivität als auch die Stabilität der Lösungen signifikant verbessert und dabei Einzelagentensysteme (SAS) sowie standardmäßige werkzeuggestützte Systeme übertrifft. Infolgedessen erreichte unser dynamisches MAS-System den ersten Platz unter den Open-Source-Projekten auf der renommierten GAIA-Rangliste. Diese Ergebnisse unterstreichen den praktischen Wert kollaborativer Agentenrollen bei der Entwicklung zuverlässigerer und vertrauenswürdigerer intelligenter Systeme.
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.