ChatPaper.aiChatPaper

OpenResearcher : Un pipeline entièrement ouvert pour la synthèse de trajectoires de recherche approfondie à long terme

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

March 17, 2026
Auteurs: Zhuofeng Li, Dongfu Jiang, Xueguang Ma, Haoxiang Zhang, Ping Nie, Yuyu Zhang, Kai Zou, Jianwen Xie, Yu Zhang, Wenhu Chen
cs.AI

Résumé

L'entraînement d'agents de recherche approfondie nécessite des trajectoires à long terme qui entrelacent recherche, agrégation de preuves et raisonnement multi-étapes. Cependant, les pipelines de collecte de données existants reposent généralement sur des API web propriétaires, rendant la synthèse de trajectoires à grande échelle coûteuse, instable et difficile à reproduire. Nous présentons OpenResearcher, un pipeline reproductible qui dissocie l'amorçage unique du corpus de la synthèse de trajectoires multi-tours et exécute la boucle de recherche et navigation entièrement hors ligne en utilisant trois primitives explicites de navigateur : recherche, ouverture et trouver, sur un corpus de 15 millions de documents. En utilisant GPT-OSS-120B comme modèle enseignant, nous synthétisons plus de 97 000 trajectoires, incluant une queue de distribution substantielle à long terme avec plus de 100 appels d'outils. Le réglage fin supervisé d'un modèle de base 30B-A3B sur ces trajectoires atteint une précision de 54,8 % sur BrowseComp-Plus, soit une amélioration de +34,0 points par rapport au modèle de base, tout en restant compétitif sur BrowseComp, GAIA et xbench-DeepSearch. Parce que l'environnement est hors ligne et entièrement instrumenté, il permet également une analyse contrôlée, où notre étude révèle des insights pratiques pour la conception de pipelines de recherche approfondie, incluant les stratégies de filtrage des données, les choix de configuration des agents, et la relation entre le succès de la récupération et la précision de la réponse finale. Nous publions le pipeline, les trajectoires synthétisées, les points de contrôle des modèles et l'environnement de recherche hors ligne à l'adresse https://github.com/TIGER-AI-Lab/OpenResearcher.
English
Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.
PDF612March 25, 2026