ChatPaper.aiChatPaper

OpenResearcher: Eine vollständig offene Pipeline zur Synthese langfristiger tiefer Forschungsverläufe

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

March 17, 2026
Autoren: Zhuofeng Li, Dongfu Jiang, Xueguang Ma, Haoxiang Zhang, Ping Nie, Yuyu Zhang, Kai Zou, Jianwen Xie, Yu Zhang, Wenhu Chen
cs.AI

Zusammenfassung

Das Training tiefgehender Forschungsagenten erfordert langfristige Trajektorien, die Suche, Evidenzaggregation und mehrstufiges Reasoning miteinander verflechten. Bisherige Datenerfassungspipelines basieren jedoch typischerweise auf proprietären Web-APIs, was die Synthese von Trajektorien in großem Maßstab kostspielig, instabil und schwer reproduzierbar macht. Wir stellen OpenResearcher vor, eine reproduzierbare Pipeline, die die einmalige Korpus-Initialisierung von der Synthese mehrstufiger Trajektorien entkoppelt und die Such- und Navigationsschleife vollständig offline unter Verwendung drei expliziter Browser-Primitive – Suche, Öffnen und Finden – über einen 15-Millionen-Dokumente umfassenden Korpus ausführt. Unter Verwendung von GPT-OSS-120B als Lehrer-Modell synthetisieren wir über 97.000 Trajektorien, einschließlich eines substantiellen Anteils langfristiger Trajektorien mit über 100 Werkzeugaufrufen. Überwachtes Feinabstimmen eines 30B-A3B-Basismodells auf diesen Trajektorien erreicht eine Genauigkeit von 54,8 % auf BrowseComp-Plus, eine Verbesserung um 34,0 Punkte gegenüber dem Basismodell, bei gleichzeitiger Wettbewerbsfähigkeit auf BrowseComp, GAIA und xbench-DeepSearch. Da die Umgebung offline und vollständig instrumentiert ist, ermöglicht sie auch kontrollierte Analysen. Unsere Studie liefert dabei praktische Einblicke in das Design tiefgehender Forschungspipelines, einschließlich Datenfilterstrategien, Agentenkonfigurationen und dem Zusammenhang zwischen Retrieval-Erfolg und finaler Antwortgenauigkeit. Wir veröffentlichen die Pipeline, die synthetisierten Trajektorien, Modell-Checkpoints und die Offline-Suchumgebung unter https://github.com/TIGER-AI-Lab/OpenResearcher.
English
Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.
PDF612March 25, 2026