OpenResearcher: Een volledig open pijplijn voor de synthese van diepgaande onderzoekspaden op lange termijn

Samenvatting

Het trainen van diepgaande onderzoeksagenten vereist trajecten met een lange horizon die zoeken, het samenvoegen van bewijsmateriaal en meerstaps redeneren door elkaar heen weven. Bestaande datainzamelingspijplijnen zijn echter doorgaans afhankelijk van propriëtaire web-API's, waardoor grootschalige trajectensynthese kostbaar, instabiel en moeilijk reproduceerbaar is. Wij presenteren OpenResearcher, een reproduceerbare pijplijn die eenmalige corpusbootstrapping ontkoppelt van multiturn-trajectensynthese en de zoek-en-browse-lus volledig offline uitvoert met behulp van drie expliciete browserprimitieven: zoeken, openen en vinden, over een corpus van 15 miljoen documenten. Met behulp van GPT-OSS-120B als het leraarmodel synthetiseren we meer dan 97.000 trajecten, inclusief een aanzienlijke lange-staart met 100+ toolaanroepen. Supervised fine-tuning van een 30B-A3B-backbone op deze trajecten behaalt een nauwkeurigheid van 54,8% op BrowseComp-Plus, een verbetering van +34,0 punten ten opzichte van het basismodel, terwijl het competitief blijft op BrowseComp, GAIA en xbench-DeepSearch. Omdat de omgeving offline en volledig geïnstrumenteerd is, maakt het ook gecontroleerde analyse mogelijk, waarbij onze studie praktische inzichten oplevert in het ontwerp van diepe onderzoekspijplijnen, inclusief datafilterstrategieën, agentconfiguratiekeuzes en hoe retrievalsucces zich verhoudt tot de uiteindelijke antwoordnauwkeurigheid. We geven de pijplijn, gesynthetiseerde trajecten, modelcheckpoints en de offline zoekomgeving vrij op https://github.com/TIGER-AI-Lab/OpenResearcher.

English

Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.

OpenResearcher: Een volledig open pijplijn voor de synthese van diepgaande onderzoekspaden op lange termijn

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Samenvatting

Support