AWorld: Dynamisch Multi-Agent Systeem met Stabiele Manoeuvres voor Robuuste GAIA Probleemoplossing
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
Auteurs: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
Samenvatting
De snelle vooruitgang van grote taalmodellen (LLMs) heeft intelligente agenten in staat gesteld om diverse externe tools te benutten voor het oplossen van complexe problemen in de echte wereld. Naarmate agenten echter steeds meer afhankelijk worden van meerdere tools, ontstaan er nieuwe uitdagingen: uitgebreide contexten uit verschillende bronnen en ruis of irrelevante tooloutputs kunnen de betrouwbaarheid en nauwkeurigheid van het systeem ondermijnen. Deze uitdagingen onderstrepen de noodzaak voor verbeterde stabiliteit in agentgebaseerde systemen. Om dit aan te pakken, introduceren we dynamische supervisie en manoeuvreermechanismen, waarmee we een robuust en dynamisch Multi-Agent Systeem (MAS) architectuur bouwen binnen het AWorld-framework. In onze aanpak roept de Uitvoeringsagent de Bewakingsagent op bij kritieke stappen om het redeneerproces te verifiëren en te corrigeren, waardoor fouten als gevolg van ruis effectief worden verminderd en de robuustheid van probleemoplossing wordt versterkt. Uitgebreide experimenten op de GAIA-testdataset laten zien dat ons dynamische manoeuvreermechanisme zowel de effectiviteit als de stabiliteit van oplossingen aanzienlijk verbetert, en daarbij single-agent systemen (SAS) en standaard tool-augmented systemen overtreft. Als resultaat behaalde ons dynamische MAS-systeem de eerste plaats onder de open-source projecten op het prestigieuze GAIA-leaderboard. Deze bevindingen benadrukken de praktische waarde van collaboratieve agentrollen bij het ontwikkelen van betrouwbaardere en vertrouwenswaardigere intelligente systemen.
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.