ChatPaper.aiChatPaper

OpenResearcher: Una Tubería Completamente Abierta para la Síntesis de Trayectorias de Investigación Profunda de Largo Horizonte

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

March 17, 2026
Autores: Zhuofeng Li, Dongfu Jiang, Xueguang Ma, Haoxiang Zhang, Ping Nie, Yuyu Zhang, Kai Zou, Jianwen Xie, Yu Zhang, Wenhu Chen
cs.AI

Resumen

El entrenamiento de agentes de investigación profunda requiere trayectorias de largo horizonte que entrelazan búsqueda, agregación de evidencias y razonamiento multi-etapa. Sin embargo, los flujos de trabajo existentes para la recolección de datos suelen depender de APIs web propietarias, lo que hace que la síntesis de trayectorias a gran escala sea costosa, inestable y difícil de reproducir. Presentamos OpenResearcher, un flujo de trabajo reproducible que desacopla el arranque único del corpus de la síntesis de trayectorias multi-turno y ejecuta el ciclo de búsqueda y navegación completamente offline utilizando tres primitivas explícitas del navegador: buscar, abrir y encontrar, sobre un corpus de 15 millones de documentos. Utilizando GPT-OSS-120B como modelo maestro, sintetizamos más de 97,000 trayectorias, incluyendo una cola significativa de largo horizonte con más de 100 llamadas a herramientas. El ajuste fino supervisado de un modelo base 30B-A3B en estas trayectorias alcanza un 54.8% de precisión en BrowseComp-Plus, una mejora de +34.0 puntos sobre el modelo base, mientras se mantiene competitivo en BrowseComp, GAIA y xbench-DeepSearch. Dado que el entorno es offline y está totalmente instrumentado, también permite análisis controlados, donde nuestro estudio revela perspectivas prácticas para el diseño de flujos de investigación profunda, incluyendo estrategias de filtrado de datos, opciones de configuración del agente, y cómo el éxito de la recuperación se relaciona con la precisión de la respuesta final. Publicamos el flujo de trabajo, las trayectorias sintetizadas, los puntos de control del modelo y el entorno de búsqueda offline en https://github.com/TIGER-AI-Lab/OpenResearcher.
English
Training deep research agents requires long-horizon trajectories that interleave search, evidence aggregation, and multi-step reasoning. However, existing data collection pipelines typically rely on proprietary web APIs, making large-scale trajectory synthesis costly, unstable, and difficult to reproduce. We present OpenResearcher, a reproducible pipeline that decouples one-time corpus bootstrapping from multi-turn trajectory synthesis and executes the search-and-browse loop entirely offline using three explicit browser primitives: search, open, and find, over a 15M-document corpus. Using GPT-OSS-120B as the teacher model, we synthesize over 97K trajectories, including a substantial long-horizon tail with 100+ tool calls. Supervised fine-tuning a 30B-A3B backbone on these trajectories achieves 54.8\% accuracy on BrowseComp-Plus, a +34.0 point improvement over the base model, while remaining competitive on BrowseComp, GAIA, and xbench-DeepSearch. Because the environment is offline and fully instrumented, it also enables controlled analysis, where our study reveals practical insights into deep research pipeline design, including data filtering strategies, agent configuration choices, and how retrieval success relates to final answer accuracy. We release the pipeline, synthesized trajectories, model checkpoints, and the offline search environment at https://github.com/TIGER-AI-Lab/OpenResearcher.
PDF612March 25, 2026