ChatPaper.aiChatPaper

OpenResearcher: 장기 심층 연구 경로 합성을 위한 완전 오픈 파이프라인

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

March 17, 2026
저자: Zhuofeng Li, Dongfu Jiang, Xueguang Ma, Haoxiang Zhang, Ping Nie, Yuyu Zhang, Kai Zou, Jianwen Xie, Yu Zhang, Wenhu Chen
cs.AI

초록

깊은 연구 에이전트를 훈련시키기 위해서는 탐색, 증거 통합, 다단계 추론이 교차되는 장기 궤적이 필요합니다. 그러나 기존 데이터 수집 파이프라인은 일반적으로 독점 웹 API에 의존하여 대규모 궤적 합성이 비용이 많이 들고 불안정하며 재현하기 어렵습니다. 본 논문에서는 1회성 코퍼스 부트스트래핑과 다중 턴 궤적 합성을 분리하고, 1,500만 개 문서 코퍼스 상에서 검색, 열기, 찾기의 세 가지 명시적 브라우저 기본 동작을 통해 검색-탐색 루프를 완전히 오프라인으로 실행하는 재현 가능한 파이프라인인 OpenResearcher를 제시합니다. GPT-OSS-120B를 교사 모델로 사용하여 97,000개 이상의 궤적을 합성했으며, 여기에는 100회 이상의 도구 호출을 포함하는 상당한 장기 궤적 꼬리 부분이 포함됩니다. 30B-A3B 백본 모델을 이러한 궤적으로 지도 미세 조정한 결과 BrowseComp-Plus에서 54.8%의 정확도를 달성하여 기본 모델 대비 +34.0점 향상되었으며, BrowseComp, GAIA, xbench-DeepSearch에서도 경쟁력을 유지했습니다. 환경이 오프라인이며 완전히 계측되어 있기 때문에 통제된 분석도 가능한데, 본 연구를 통해 데이터 필터링 전략, 에이전트 구성 선택, 최종 답변 정확도와의 검색 성공도 연관성을 포함한 깊은 연구 파이프라인 설계에 대한 실용적인 통찰력을 제시합니다. 파이프라인, 합성된 궤적, 모델 체크포인트, 오프라인 검색 환경을 https://github.com/TIGER-AI-Lab/OpenResearcher에서 공개합니다.
English
Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.
PDF612March 25, 2026