AWorld: Sistema Multi-Agente Dinamico con Manovra Stabile per la Risoluzione Robusta del Problema GAIA
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
Autori: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
Abstract
Il rapido progresso dei modelli linguistici di grandi dimensioni (LLM) ha consentito agli agenti intelligenti di sfruttare strumenti esterni diversificati per risolvere complessi problemi del mondo reale. Tuttavia, man mano che gli agenti dipendono sempre più da molteplici strumenti, si trovano ad affrontare nuove sfide: contesti estesi provenienti da fonti disparate e output di strumenti rumorosi o irrilevanti possono compromettere l'affidabilità e l'accuratezza del sistema. Queste sfide sottolineano la necessità di una maggiore stabilità nei sistemi basati su agenti. Per affrontare questo problema, introduciamo meccanismi di supervisione dinamica e di manovra, costruendo un'architettura robusta e dinamica di Sistema Multi-Agente (MAS) all'interno del framework AWorld. Nel nostro approccio, l'Agente di Esecuzione invoca l'Agente di Controllo in passaggi critici per verificare e correggere il processo di ragionamento, riducendo efficacemente gli errori derivanti dal rumore e rafforzando la robustezza nella risoluzione dei problemi. Esperimenti estensivi sul dataset di test GAIA rivelano che il nostro meccanismo di manovra dinamica migliora significativamente sia l'efficacia che la stabilità delle soluzioni, superando i sistemi a singolo agente (SAS) e i sistemi standard potenziati da strumenti. Di conseguenza, il nostro sistema MAS dinamico ha raggiunto il primo posto tra i progetti open-source sulla prestigiosa classifica GAIA. Questi risultati evidenziano il valore pratico dei ruoli collaborativi degli agenti nello sviluppo di sistemi intelligenti più affidabili e degni di fiducia.
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.