ChatPaper.aiChatPaper

AWorld: Sistema Multi-Agente Dinamico con Manovra Stabile per la Risoluzione Robusta del Problema GAIA

AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving

August 13, 2025
Autori: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI

Abstract

Il rapido progresso dei modelli linguistici di grandi dimensioni (LLM) ha consentito agli agenti intelligenti di sfruttare strumenti esterni diversificati per risolvere complessi problemi del mondo reale. Tuttavia, man mano che gli agenti dipendono sempre più da molteplici strumenti, si trovano ad affrontare nuove sfide: contesti estesi provenienti da fonti disparate e output di strumenti rumorosi o irrilevanti possono compromettere l'affidabilità e l'accuratezza del sistema. Queste sfide sottolineano la necessità di una maggiore stabilità nei sistemi basati su agenti. Per affrontare questo problema, introduciamo meccanismi di supervisione dinamica e di manovra, costruendo un'architettura robusta e dinamica di Sistema Multi-Agente (MAS) all'interno del framework AWorld. Nel nostro approccio, l'Agente di Esecuzione invoca l'Agente di Controllo in passaggi critici per verificare e correggere il processo di ragionamento, riducendo efficacemente gli errori derivanti dal rumore e rafforzando la robustezza nella risoluzione dei problemi. Esperimenti estensivi sul dataset di test GAIA rivelano che il nostro meccanismo di manovra dinamica migliora significativamente sia l'efficacia che la stabilità delle soluzioni, superando i sistemi a singolo agente (SAS) e i sistemi standard potenziati da strumenti. Di conseguenza, il nostro sistema MAS dinamico ha raggiunto il primo posto tra i progetti open-source sulla prestigiosa classifica GAIA. Questi risultati evidenziano il valore pratico dei ruoli collaborativi degli agenti nello sviluppo di sistemi intelligenti più affidabili e degni di fiducia.
English
The rapid advancement of large language models (LLMs) has empowered intelligent agents to leverage diverse external tools for solving complex real-world problems. However, as agents increasingly depend on multiple tools, they encounter new challenges: extended contexts from disparate sources and noisy or irrelevant tool outputs can undermine system reliability and accuracy. These challenges underscore the necessity for enhanced stability in agent-based systems. To address this, we introduce dynamic supervision and maneuvering mechanisms, constructing a robust and dynamic Multi-Agent System (MAS) architecture within the AWorld framework. In our approach, the Execution Agent invokes the Guard Agent at critical steps to verify and correct the reasoning process, effectively reducing errors arising from noise and bolstering problem-solving robustness. Extensive experiments on the GAIA test dataset reveal that our dynamic maneuvering mechanism significantly improves both the effectiveness and stability of solutions, outperforming single-agent system (SAS) and standard tool-augmented systems. As a result, our dynamic MAS system achieved first place among open-source projects on the prestigious GAIA leaderboard. These findings highlight the practical value of collaborative agent roles in developing more reliable and trustworthy intelligent systems.
PDF322August 14, 2025