ChatPaper.aiChatPaper

Rapport Technique de Tongyi DeepResearch

Tongyi DeepResearch Technical Report

October 28, 2025
papers.authors: Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, Dingchu Zhang, Fei Huang, Guangyu Li, Guoxin Chen, Huifeng Yin, Jialong Wu, Jingren Zhou, Kuan Li, Liangcai Su, Litu Ou, Liwen Zhang, Pengjun Xie, Rui Ye, Wenbiao Yin, Xinmiao Yu, Xinyu Wang, Xixi Wu, Xuanzhong Chen, Yida Zhao, Zhen Zhang, Zhengwei Tao, Zhongwang Zhang, Zile Qiao, Chenxi Wang, Donglei Yu, Gang Fu, Haiyang Shen, Jiayin Yang, Jun Lin, Junkai Zhang, Kui Zeng, Li Yang, Hailong Yin, Maojia Song, Ming Yan, Peng Xia, Qian Xiao, Rui Min, Ruixue Ding, Runnan Fang, Shaowei Chen, Shen Huang, Shihang Wang, Shihao Cai, Weizhou Shen, Xiaobin Wang, Xin Guan, Xinyu Geng, Yingcheng Shi, Yuning Wu, Zhuo Chen, Zijian Li, Yong Jiang
cs.AI

papers.abstract

Nous présentons Tongyi DeepResearch, un modèle de langage évolué agentique spécialement conçu pour les tâches de recherche approfondie nécessitant une quête d'information à long terme. Pour favoriser une agence de recherche autonome et approfondie, Tongyi DeepResearch est développé grâce à un cadre d'apprentissage de bout en bout combinant un pré-entraînement agentique et un post-entraînement agentique, permettant un raisonnement et une recherche d'information évolutifs pour des tâches complexes. Nous avons conçu un pipeline de synthèse de données hautement évolutif, entièrement automatique, qui ne repose pas sur une annotation humaine coûteuse et alimente toutes les phases d'entraînement. En construisant des environnements personnalisés pour chaque étape, notre système permet des interactions stables et cohérentes tout au long du processus. Tongyi DeepResearch, doté de 30,5 milliards de paramètres au total avec seulement 3,3 milliards activés par token, obtient des performances de pointe sur une série de benchmarks de recherche approfondie agentique, incluant Humanity's Last Exam, BrowseComp, BrowseComp-ZH, WebWalkerQA, xbench-DeepSearch, FRAMES et xbench-DeepSearch-2510. Nous ouvrons en accès libre le modèle, le cadre de travail et les solutions complètes afin de renforcer les capacités de la communauté scientifique.
English
We present Tongyi DeepResearch, an agentic large language model, which is specifically designed for long-horizon, deep information-seeking research tasks. To incentivize autonomous deep research agency, Tongyi DeepResearch is developed through an end-to-end training framework that combines agentic mid-training and agentic post-training, enabling scalable reasoning and information seeking across complex tasks. We design a highly scalable data synthesis pipeline that is fully automatic, without relying on costly human annotation, and empowers all training stages. By constructing customized environments for each stage, our system enables stable and consistent interactions throughout. Tongyi DeepResearch, featuring 30.5 billion total parameters, with only 3.3 billion activated per token, achieves state-of-the-art performance across a range of agentic deep research benchmarks, including Humanity's Last Exam, BrowseComp, BrowseComp-ZH, WebWalkerQA, xbench-DeepSearch, FRAMES and xbench-DeepSearch-2510. We open-source the model, framework, and complete solutions to empower the community.
PDF954December 1, 2025