ChatPaper.aiChatPaper

WebResearcher: Sfruttare la capacità di ragionamento illimitato negli agenti con orizzonti temporali lunghi

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

September 16, 2025
Autori: Zile Qiao, Guoxin Chen, Xuanzhong Chen, Donglei Yu, Wenbiao Yin, Xinyu Wang, Zhen Zhang, Baixuan Li, Huifeng Yin, Kuan Li, Rui Min, Minpeng Liao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI

Abstract

I recenti progressi nei sistemi di ricerca approfondita hanno dimostrato il potenziale degli agenti di intelligenza artificiale di scoprire e sintetizzare autonomamente conoscenza da fonti esterne. In questo articolo, presentiamo WebResearcher, un nuovo framework per costruire tali agenti attraverso due componenti chiave: (1) WebResearcher, un paradigma iterativo di ricerca approfondita che riformula la ricerca approfondita come un Processo Decisionale di Markov, in cui gli agenti consolidano periodicamente i risultati in report in evoluzione mantenendo spazi di lavoro focalizzati, superando il soffocamento contestuale e la contaminazione da rumore che affliggono gli approcci mono-contestuali esistenti; e (2) WebFrontier, un motore di sintesi dati scalabile che genera dati di addestramento di alta qualità attraverso l'escalation di complessità potenziata da strumenti, consentendo la creazione sistematica di task di ricerca che colmano il divario tra il richiamo passivo della conoscenza e la costruzione attiva della conoscenza. È importante notare che i dati di addestramento del nostro paradigma migliorano significativamente le capacità di utilizzo degli strumenti anche per i metodi mono-contestuali tradizionali. Inoltre, il nostro paradigma si scala naturalmente attraverso il pensiero parallelo, consentendo l'esplorazione concorrente multi-agente per conclusioni più complete. Esperimenti estesi su 6 benchmark impegnativi dimostrano che WebResearcher raggiunge prestazioni all'avanguardia, superando persino i sistemi proprietari più avanzati.
English
Recent advances in deep-research systems have demonstrated the potential for AI agents to autonomously discover and synthesize knowledge from external sources. In this paper, we introduce WebResearcher, a novel framework for building such agents through two key components: (1) WebResearcher, an iterative deep-research paradigm that reformulates deep research as a Markov Decision Process, where agents periodically consolidate findings into evolving reports while maintaining focused workspaces, overcoming the context suffocation and noise contamination that plague existing mono-contextual approaches; and (2) WebFrontier, a scalable data synthesis engine that generates high-quality training data through tool-augmented complexity escalation, enabling systematic creation of research tasks that bridge the gap between passive knowledge recall and active knowledge construction. Notably, we find that the training data from our paradigm significantly enhances tool-use capabilities even for traditional mono-contextual methods. Furthermore, our paradigm naturally scales through parallel thinking, enabling concurrent multi-agent exploration for more comprehensive conclusions. Extensive experiments across 6 challenging benchmarks demonstrate that WebResearcher achieves state-of-the-art performance, even surpassing frontier proprietary systems.
PDF665September 19, 2025