ChatPaper.aiChatPaper

AWorld: Orchestrazione della Ricetta di Addestramento per l'IA Agente

AWorld: Orchestrating the Training Recipe for Agentic AI

August 28, 2025
Autori: Chengyue Yu, Siyuan Lu, Chenyi Zhuang, Dong Wang, Qintong Wu, Zongyue Li, Runsheng Gan, Chunfeng Wang, Siqi Hou, Gaochi Huang, Wenlong Yan, Lifeng Hong, Aohui Xue, Yanfeng Wang, Jinjie Gu, David Tsai, Tao Lin
cs.AI

Abstract

Il paradigma dell'apprendimento attraverso la pratica è cruciale per lo sviluppo di sistemi di intelligenza artificiale agentici capaci, ma è fortemente limitato dalla generazione inefficiente di esperienze, un collo di bottiglia particolarmente evidente in benchmark complessi come GAIA. Per affrontare questo problema, introduciamo AWorld, un sistema open-source progettato per l'interazione su larga scala tra agente e ambiente. Distribuendo i compiti su un cluster, AWorld accelera la raccolta di esperienze di 14,6 volte rispetto all'esecuzione sequenziale standard su un singolo nodo. Questo significativo aumento di velocità rende l'apprendimento per rinforzo estensivo pratico e scalabile. Sfruttando questa capacità, abbiamo addestrato un agente basato su Qwen3-32B che supera significativamente il modello di base, aumentando la sua accuratezza complessiva su GAIA dal 21,59% al 32,23%. Nei livelli più impegnativi del benchmark, il nostro agente raggiunge un punteggio del 16,33%, superando le prestazioni dei principali modelli proprietari. Il nostro sistema open-source e l'agente risultante forniscono una guida pratica per un'intera pipeline di addestramento di intelligenza artificiale agentica, dall'interazione efficiente al miglioramento dimostrabile del modello.
English
The learning from practice paradigm is crucial for developing capable Agentic AI systems, yet it is severely hampered by inefficient experience generation, a bottleneck especially pronounced in complex benchmarks like GAIA. To address this, we introduce AWorld, an open-source system engineered for large-scale agent-environment interaction. By distributing tasks across a cluster, AWorld accelerates experience collection by 14.6x compared to standard single-node, sequential execution. This critical speedup makes extensive reinforcement learning practical and scalable. Leveraging this capability, we trained a Qwen3-32B-based agent that significantly outperforms its base model, increasing its overall GAIA accuracy from 21.59% to 32.23%. On the benchmark's most challenging levels, our agent achieves a score of 16.33%, surpassing the performance of leading proprietary models. Our open-source system and resulting agent provide a practical blueprint for a complete agentic AI training pipeline, from efficient interaction to demonstrable model improvement.
PDF382August 29, 2025