ChatPaper.aiChatPaper

WebResearcher: Entfesselung unbegrenzter Denkfähigkeit in Agenten mit langfristigen Zielen

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

September 16, 2025
papers.authors: Zile Qiao, Guoxin Chen, Xuanzhong Chen, Donglei Yu, Wenbiao Yin, Xinyu Wang, Zhen Zhang, Baixuan Li, Huifeng Yin, Kuan Li, Rui Min, Minpeng Liao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI

papers.abstract

Jüngste Fortschritte in Deep-Research-Systemen haben das Potenzial von KI-Agenten aufgezeigt, eigenständig Wissen aus externen Quellen zu entdecken und zu synthetisieren. In diesem Artikel stellen wir WebResearcher vor, ein neuartiges Framework zur Entwicklung solcher Agenten, das auf zwei Schlüsselkomponenten basiert: (1) WebResearcher, ein iteratives Deep-Research-Paradigma, das Deep Research als Markov-Entscheidungsprozess reformuliert, bei dem Agenten ihre Erkenntnisse periodisch in sich entwickelnde Berichte integrieren, während sie fokussierte Arbeitsbereiche aufrechterhalten, wodurch die Kontextüberlastung und Rauschkontamination überwunden werden, die bestehende monokontextuelle Ansätze plagen; und (2) WebFrontier, eine skalierbare Datensynthese-Engine, die hochwertige Trainingsdaten durch werkzeuggestützte Komplexitätssteigerung generiert und die systematische Erstellung von Forschungsaufgaben ermöglicht, die die Lücke zwischen passiver Wissensabrufung und aktiver Wissenskonstruktion schließen. Bemerkenswerterweise stellen wir fest, dass die Trainingsdaten aus unserem Paradigma die Werkzeugnutzungsfähigkeiten sogar für traditionelle monokontextuelle Methoden signifikant verbessern. Darüber hinaus skaliert unser Paradigma natürlich durch paralleles Denken, was eine gleichzeitige Multi-Agenten-Exploration für umfassendere Schlussfolgerungen ermöglicht. Umfangreiche Experimente über 6 anspruchsvolle Benchmarks zeigen, dass WebResearcher state-of-the-art Leistung erzielt und sogar proprietäre Spitzensysteme übertrifft.
English
Recent advances in deep-research systems have demonstrated the potential for AI agents to autonomously discover and synthesize knowledge from external sources. In this paper, we introduce WebResearcher, a novel framework for building such agents through two key components: (1) WebResearcher, an iterative deep-research paradigm that reformulates deep research as a Markov Decision Process, where agents periodically consolidate findings into evolving reports while maintaining focused workspaces, overcoming the context suffocation and noise contamination that plague existing mono-contextual approaches; and (2) WebFrontier, a scalable data synthesis engine that generates high-quality training data through tool-augmented complexity escalation, enabling systematic creation of research tasks that bridge the gap between passive knowledge recall and active knowledge construction. Notably, we find that the training data from our paradigm significantly enhances tool-use capabilities even for traditional mono-contextual methods. Furthermore, our paradigm naturally scales through parallel thinking, enabling concurrent multi-agent exploration for more comprehensive conclusions. Extensive experiments across 6 challenging benchmarks demonstrate that WebResearcher achieves state-of-the-art performance, even surpassing frontier proprietary systems.
PDF493September 17, 2025