AWorld: Динамическая мультиагентная система с устойчивым маневрированием для надежного решения задач GAIA
AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving
August 13, 2025
Авторы: Zhitian Xie, Qintong Wu, Chengyue Yu, Chenyi Zhuang, Jinjie Gu
cs.AI
Аннотация
Быстрое развитие крупных языковых моделей (LLM) позволило интеллектуальным агентам использовать разнообразные внешние инструменты для решения сложных задач в реальном мире. Однако по мере того, как агенты всё больше зависят от множества инструментов, они сталкиваются с новыми вызовами: расширенные контексты из различных источников, а также зашумлённые или нерелевантные выходные данные инструментов могут подрывать надёжность и точность системы. Эти вызовы подчеркивают необходимость повышения стабильности в системах на основе агентов. Для решения этой проблемы мы предлагаем механизмы динамического контроля и управления, создавая устойчивую и динамичную архитектуру многоагентной системы (MAS) в рамках платформы AWorld. В нашем подходе Исполнительный Агент вызывает Контролирующего Агента на ключевых этапах для проверки и корректировки процесса рассуждений, что эффективно снижает ошибки, вызванные шумом, и повышает устойчивость решения задач. Многочисленные эксперименты на тестовом наборе данных GAIA показывают, что наш механизм динамического управления значительно улучшает как эффективность, так и стабильность решений, превосходя одноагентные системы (SAS) и стандартные системы с использованием инструментов. В результате наша динамическая MAS система заняла первое место среди проектов с открытым исходным кодом на престижном рейтинге GAIA. Эти результаты подчеркивают практическую ценность совместных ролей агентов в разработке более надёжных и доверенных интеллектуальных систем.
English
The rapid advancement of large language models (LLMs) has empowered
intelligent agents to leverage diverse external tools for solving complex
real-world problems. However, as agents increasingly depend on multiple tools,
they encounter new challenges: extended contexts from disparate sources and
noisy or irrelevant tool outputs can undermine system reliability and accuracy.
These challenges underscore the necessity for enhanced stability in agent-based
systems. To address this, we introduce dynamic supervision and maneuvering
mechanisms, constructing a robust and dynamic Multi-Agent System (MAS)
architecture within the AWorld framework. In our approach, the Execution Agent
invokes the Guard Agent at critical steps to verify and correct the reasoning
process, effectively reducing errors arising from noise and bolstering
problem-solving robustness. Extensive experiments on the GAIA test dataset
reveal that our dynamic maneuvering mechanism significantly improves both the
effectiveness and stability of solutions, outperforming single-agent system
(SAS) and standard tool-augmented systems. As a result, our dynamic MAS system
achieved first place among open-source projects on the prestigious GAIA
leaderboard. These findings highlight the practical value of collaborative
agent roles in developing more reliable and trustworthy intelligent systems.