OpenResearcher: Полностью открытый конвейер для синтеза глубоких исследовательских траекторий с длительным горизонтом планирования
OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis
March 17, 2026
Авторы: Zhuofeng Li, Dongfu Jiang, Xueguang Ma, Haoxiang Zhang, Ping Nie, Yuyu Zhang, Kai Zou, Jianwen Xie, Yu Zhang, Wenhu Chen
cs.AI
Аннотация
Обучение глубоких исследовательских агентов требует длительных траекторий, которые чередуют поиск, агрегацию свидетельств и многошаговые рассуждения. Однако существующие конвейеры сбора данных обычно полагаются на проприетарные веб-API, что делает синтез крупномасштабных траекторий дорогостоящим, нестабильным и сложным для воспроизведения. Мы представляем OpenResearcher — воспроизводимый конвейер, который разделяет однократную начальную загрузку корпуса и многоходовый синтез траекторий и полностью выполняет цикл «поиск-просмотр» в автономном режиме, используя три явных браузерных примитива: поиск, открытие и поиск внутри страницы, работая с корпусом из 15 миллионов документов. Используя GPT-OSS-120B в качестве учительской модели, мы синтезировали более 97 тысяч траекторий, включая значительную часть длинных траекторий со 100+ вызовами инструментов. Контролируемое тонкое обучение модели-основы 30B-A3B на этих траекториях позволяет достичь точности 54,8% на BrowseComp-Plus, что на 34,0 пункта выше, чем у базовой модели, при сохранении конкурентоспособности на BrowseComp, GAIA и xbench-DeepSearch. Поскольку среда работает автономно и полностью инструментирована, это также позволяет проводить контролируемый анализ; наше исследование выявляет практические аспекты проектирования конвейера глубокого исследования, включая стратегии фильтрации данных, выбор конфигурации агента и то, как успех поиска связан с точностью конечного ответа. Мы публикуем конвейер, синтезированные траектории, контрольные точки модели и автономную поисковую среду по адресу https://github.com/TIGER-AI-Lab/OpenResearcher.
English
Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.