ChatPaper.aiChatPaper

WebResearcher: Раскрытие неограниченных возможностей рассуждения в агентах с длительным горизонтом планирования

WebResearcher: Unleashing unbounded reasoning capability in Long-Horizon Agents

September 16, 2025
Авторы: Zile Qiao, Guoxin Chen, Xuanzhong Chen, Donglei Yu, Wenbiao Yin, Xinyu Wang, Zhen Zhang, Baixuan Li, Huifeng Yin, Kuan Li, Rui Min, Minpeng Liao, Yong Jiang, Pengjun Xie, Fei Huang, Jingren Zhou
cs.AI

Аннотация

Последние достижения в системах глубокого исследования продемонстрировали потенциал ИИ-агентов для автономного обнаружения и синтеза знаний из внешних источников. В данной статье мы представляем WebResearcher, новую платформу для создания таких агентов, основанную на двух ключевых компонентах: (1) WebResearcher, итеративная парадигма глубокого исследования, которая переформулирует глубокое исследование как процесс принятия решений Маркова, где агенты периодически объединяют результаты в эволюционирующие отчеты, сохраняя при этом сфокусированные рабочие пространства, что позволяет преодолеть проблемы контекстного удушения и шумового загрязнения, характерные для существующих моно-контекстных подходов; и (2) WebFrontier, масштабируемый механизм синтеза данных, который генерирует высококачественные обучающие данные за счет инструментально-усиленного усложнения, что позволяет систематически создавать исследовательские задачи, устраняющие разрыв между пассивным воспроизведением знаний и активным их конструированием. Примечательно, что обучающие данные, полученные в рамках нашей парадигмы, значительно улучшают способности к использованию инструментов даже для традиционных моно-контекстных методов. Кроме того, наша парадигма естественным образом масштабируется за счет параллельного мышления, позволяя одновременное исследование несколькими агентами для получения более комплексных выводов. Многочисленные эксперименты на 6 сложных тестовых наборах демонстрируют, что WebResearcher достигает наилучших результатов, превосходя даже передовые проприетарные системы.
English
Recent advances in deep-research systems have demonstrated the potential for AI agents to autonomously discover and synthesize knowledge from external sources. In this paper, we introduce WebResearcher, a novel framework for building such agents through two key components: (1) WebResearcher, an iterative deep-research paradigm that reformulates deep research as a Markov Decision Process, where agents periodically consolidate findings into evolving reports while maintaining focused workspaces, overcoming the context suffocation and noise contamination that plague existing mono-contextual approaches; and (2) WebFrontier, a scalable data synthesis engine that generates high-quality training data through tool-augmented complexity escalation, enabling systematic creation of research tasks that bridge the gap between passive knowledge recall and active knowledge construction. Notably, we find that the training data from our paradigm significantly enhances tool-use capabilities even for traditional mono-contextual methods. Furthermore, our paradigm naturally scales through parallel thinking, enabling concurrent multi-agent exploration for more comprehensive conclusions. Extensive experiments across 6 challenging benchmarks demonstrate that WebResearcher achieves state-of-the-art performance, even surpassing frontier proprietary systems.
PDF493September 17, 2025