ChatPaper.aiChatPaper

WebResearcher : Libérer les capacités de raisonnement illimitées dans les agents à horizon long

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

September 16, 2025
papers.authors: Zile Qiao, Guoxin Chen, Xuanzhong Chen, Donglei Yu, Wenbiao Yin, Xinyu Wang, Zhen Zhang, Baixuan Li, Huifeng Yin, Kuan Li, Rui Min, Minpeng Liao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI

papers.abstract

Les récents progrès dans les systèmes de recherche approfondie ont démontré le potentiel des agents d'IA à découvrir et synthétiser de manière autonome des connaissances à partir de sources externes. Dans cet article, nous présentons WebResearcher, un nouveau cadre pour construire de tels agents à travers deux composants clés : (1) WebResearcher, un paradigme de recherche approfondie itérative qui reformule la recherche approfondie comme un processus de décision markovien, où les agents consolident périodiquement leurs découvertes dans des rapports évolutifs tout en maintenant des espaces de travail focalisés, surmontant ainsi l'étouffement contextuel et la contamination par le bruit qui affectent les approches mono-contextuelles existantes ; et (2) WebFrontier, un moteur de synthèse de données scalable qui génère des données d'entraînement de haute qualité grâce à une escalade de complexité assistée par des outils, permettant la création systématique de tâches de recherche qui comblent le fossé entre le rappel passif de connaissances et la construction active de connaissances. Notamment, nous constatons que les données d'entraînement issues de notre paradigme améliorent significativement les capacités d'utilisation d'outils, même pour les méthodes mono-contextuelles traditionnelles. De plus, notre paradigme s'adapte naturellement grâce à la pensée parallèle, permettant une exploration multi-agent concurrente pour des conclusions plus exhaustives. Des expériences approfondies sur 6 benchmarks complexes démontrent que WebResearcher atteint des performances de pointe, surpassant même les systèmes propriétaires les plus avancés.
English
Recent advances in deep-research systems have demonstrated the potential for AI agents to autonomously discover and synthesize knowledge from external sources. In this paper, we introduce WebResearcher, a novel framework for building such agents through two key components: (1) WebResearcher, an iterative deep-research paradigm that reformulates deep research as a Markov Decision Process, where agents periodically consolidate findings into evolving reports while maintaining focused workspaces, overcoming the context suffocation and noise contamination that plague existing mono-contextual approaches; and (2) WebFrontier, a scalable data synthesis engine that generates high-quality training data through tool-augmented complexity escalation, enabling systematic creation of research tasks that bridge the gap between passive knowledge recall and active knowledge construction. Notably, we find that the training data from our paradigm significantly enhances tool-use capabilities even for traditional mono-contextual methods. Furthermore, our paradigm naturally scales through parallel thinking, enabling concurrent multi-agent exploration for more comprehensive conclusions. Extensive experiments across 6 challenging benchmarks demonstrate that WebResearcher achieves state-of-the-art performance, even surpassing frontier proprietary systems.
PDF493September 17, 2025