통이 딥리서치 기술 보고서
Tongyi DeepResearch Technical Report
October 28, 2025
저자: Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, Dingchu Zhang, Fei Huang, Guangyu Li, Guoxin Chen, Huifeng Yin, Jialong Wu, Jingren Zhou, Kuan Li, Liangcai Su, Litu Ou, Liwen Zhang, Pengjun Xie, Rui Ye, Wenbiao Yin, Xinmiao Yu, Xinyu Wang, Xixi Wu, Xuanzhong Chen, Yida Zhao, Zhen Zhang, Zhengwei Tao, Zhongwang Zhang, Zile Qiao, Chenxi Wang, Donglei Yu, Gang Fu, Haiyang Shen, Jiayin Yang, Jun Lin, Junkai Zhang, Kui Zeng, Li Yang, Hailong Yin, Maojia Song, Ming Yan, Peng Xia, Qian Xiao, Rui Min, Ruixue Ding, Runnan Fang, Shaowei Chen, Shen Huang, Shihang Wang, Shihao Cai, Weizhou Shen, Xiaobin Wang, Xin Guan, Xinyu Geng, Yingcheng Shi, Yuning Wu, Zhuo Chen, Zijian Li, Yong Jiang
cs.AI
초록
우리는 장기적이고 심층적인 정보 탐색 연구 과제를 위해 특별히 설계된 에이전트형 대규모 언어 모델인 Tongyi DeepResearch를 소개한다. 자율적인 심층 연구 능력을 고취하기 위해 Tongyi DeepResearch는 에이전트 중간 훈련과 에이전트 사후 훈련을 결합한 종단간 훈련 프레임워크를 통해 개발되어 복잡한 작업 전반에 걸쳐 확장 가능한 추론 및 정보 탐색이 가능하다. 우리는 고비용의 인간 주석에 의존하지 않는 완전 자동화된 고도로 확장 가능한 데이터 합성 파이프라인을 설계하여 모든 훈련 단계를 지원한다. 각 단계별 맞춤형 환경을 구축함으로써 우리 시스템은 전 과정에 걸쳐 안정적이고 일관된 상호작용을 가능하게 한다. 총 305억 개의 매개변수 중 토큰당 33억 개만 활성화되는 Tongyi DeepResearch는 Humanity's Last Exam, BrowseComp, BrowseComp-ZH, WebWalkerQA, xbench-DeepSearch, FRAMES, xbench-DeepSearch-2510 등 일련의 에이전트 심층 연구 벤치마크에서 최첨단 성능을 달성한다. 우리는 커뮤니티의 발전을 위해 모델, 프레임워크 및 완전한 솔루션을 오픈소스로 공개한다.
English
We present Tongyi DeepResearch, an agentic large language model, which is
specifically designed for long-horizon, deep information-seeking research
tasks. To incentivize autonomous deep research agency, Tongyi DeepResearch is
developed through an end-to-end training framework that combines agentic
mid-training and agentic post-training, enabling scalable reasoning and
information seeking across complex tasks. We design a highly scalable data
synthesis pipeline that is fully automatic, without relying on costly human
annotation, and empowers all training stages. By constructing customized
environments for each stage, our system enables stable and consistent
interactions throughout. Tongyi DeepResearch, featuring 30.5 billion total
parameters, with only 3.3 billion activated per token, achieves
state-of-the-art performance across a range of agentic deep research
benchmarks, including Humanity's Last Exam, BrowseComp, BrowseComp-ZH,
WebWalkerQA, xbench-DeepSearch, FRAMES and xbench-DeepSearch-2510. We
open-source the model, framework, and complete solutions to empower the
community.