ChatPaper.aiChatPaper

Agent0: Sviluppo di Agenti Auto-Evolventi a Partire da Dati Zero tramite Ragionamento Integrato con Strumenti

Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning

November 20, 2025
Autori: Peng Xia, Kaide Zeng, Jiaqi Liu, Can Qin, Fang Wu, Yiyang Zhou, Caiming Xiong, Huaxiu Yao
cs.AI

Abstract

Gli Agenti di Modelli Linguistici di Grande Dimensione (LLM), spesso addestrati con Apprendimento per Rinforzo (RL), sono limitati da una dipendenza da dati curati da esseri umani, il che riduce la scalabilità e vincola l'IA alla conoscenza umana. I framework di auto-evoluzione esistenti offrono un'alternativa, ma sono tipicamente limitati dalle capacità intrinseche del modello e da interazioni a singolo round, ostacolando lo sviluppo di curricula complessi che coinvolgono l'uso di strumenti o ragionamento dinamico. Introduciamo Agent0, un framework completamente autonomo che evolve agenti ad alte prestazioni senza dati esterni attraverso una co-evoluzione multi-step e un'integrazione seamless di strumenti. Agent0 stabilisce una competizione simbiotica tra due agenti inizializzati dallo stesso LLM di base: un agente curriculum che propone task di frontiera progressivamente più impegnativi, e un agente esecutore che impara a risolverli. Integriamo strumenti esterni per potenziare la capacità di problem-solving dell'esecutore; questo miglioramento, a sua volta, spinge l'agente curriculum a costruire task più complessi e consapevoli degli strumenti. Attraverso questo processo iterativo, Agent0 stabilisce un ciclo auto-rinforzante che produce continuamente curricula di alta qualità. Empiricamente, Agent0 aumenta sostanzialmente le capacità di ragionamento, migliorando il modello Qwen3-8B-Base del 18% nel ragionamento matematico e del 24% sui benchmark di ragionamento generale. Il codice è disponibile all'indirizzo https://github.com/aiming-lab/Agent0.
English
Large Language Model (LLM) Agents, often trained with Reinforcement Learning (RL), are constrained by a dependency on human-curated data, limiting scalability and tethering AI to human knowledge. Existing self-evolution frameworks offer an alternative but are typically restricted by the model's inherent capabilities and single-round interactions, hindering the development of complex curricula involving tool use or dynamic reasoning. We introduce Agent0, a fully autonomous framework that evolves high-performing agents without external data through multi-step co-evolution and seamless tool integration. Agent0 establishes a symbiotic competition between two agents initialized from the same base LLM: a curriculum agent that proposes increasingly challenging frontier tasks, and an executor agent that learns to solve them. We integrate external tools to enhance the executor's problem-solving capacity; this improvement, in turn, pressures the curriculum agent to construct more complex, tool-aware tasks. Through this iterative process, Agent0 establishes a self-reinforcing cycle that continuously produces high-quality curricula. Empirically, Agent0 substantially boosts reasoning capabilities, improving the Qwen3-8B-Base model by 18% on mathematical reasoning and 24% on general reasoning benchmarks. Code is available at https://github.com/aiming-lab/Agent0.
PDF974December 1, 2025