Rapport technique Ling and Ring 2.6 : Intelligence agentique efficace et instantanée à l'échelle du billion de paramètres

Résumé

L’intelligence agentique efficace et scalable nécessite des modèles capables de fournir à la fois des réponses à faible latence et de fortes capacités de raisonnement, tout en restant pratiques à entraîner, à servir et à déployer. Dans ce rapport, nous présentons Ling-2.6 et Ring-2.6, une famille de modèles conçue pour relever ce défi à grande échelle. Ling-2.6 est optimisé pour la génération instantanée de réponses et une capacité élevée par jeton de sortie, tandis que Ring-2.6 est taillé pour un raisonnement plus profond et des flux de travail agentiques plus avancés. Au lieu d’un entraînement à partir de zéro, nous faisons évoluer le modèle de base Ling-2.0 grâce à un pré-entraînement par migration architecturale et à un post-entraînement à grande échelle. Cette évolution est guidée par une conception conjointe unifiée de l’architecture du modèle, des objectifs d’optimisation, des systèmes de service et des environnements d’entraînement agentiques, permettant des améliorations à la fois de la capacité du modèle et de l’efficacité du déploiement. Au niveau architectural, nous introduisons une conception d’attention linéaire hybride intégrant Lightning Attention avec MLA, améliorant l’efficacité de l’entraînement et du décodage sur des contextes longs. Pour renforcer davantage l’efficacité des jetons, nous optimisons la capacité par jeton de sortie via la Chaîne de Pensée Évolutionnaire, l’Optimisation des Politiques par Unités Linguistiques, l’alignement bidirectionnel des préférences et la distillation des réponses correctes les plus courtes. Pour les capacités agentiques, nous proposons KPop, un cadre d’apprentissage par renforcement conçu pour soutenir l’entraînement stable de Ring-2.6-1T sur des données ancrées dans l’environnement à grande échelle. KPop améliore l’efficacité de l’entraînement grâce à une planification asynchrone entre le codage, la recherche, l’utilisation d’outils et l’exécution de workflows, permettant un apprentissage scalable à partir d’interactions complexes agent-environnement. Ensemble, Ling-2.6 et Ring-2.6 offrent une voie pratique vers des systèmes agentiques efficaces, scalables et ouverts. Nous open-sourçons tous les points de contrôle de la famille 2.6 pour soutenir la recherche et le développement futurs en intelligence agentique pratique.

English

Efficient and scalable agentic intelligence requires models that can deliver both low-latency responses and strong reasoning capabilities while remaining practical to train, serve, and deploy. In this report, we present Ling-2.6 and Ring-2.6, a family of models designed to address this challenge at scale. Ling-2.6 is optimized for instant response generation and high capability per output token, whereas Ring-2.6 is tailored for deeper reasoning and more advanced agentic workflows. Instead of training from scratch, we upgrade the Ling-2.0 base model through architectural migration pre-training and large-scale post-training. This upgrade is guided by a unified co-design of model architecture, optimization objectives, serving systems, and agent training environments, enabling improvements in both model capability and deployment efficiency. At the architectural level, we introduce a hybrid linear attention design that integrates Lightning Attention with MLA, improving the efficiency of long-context training and decoding. To further enhance token efficiency, we optimize capability per output token through Evolutionary Chain-of-Thought, Linguistic Unit Policy Optimization, bidirectional preference alignment, and shortest-correct-response distillation. For agentic capabilities, we propose KPop, a reinforcement learning framework designed to support stable training of Ring-2.6-1T on large-scale environment-grounded data. KPop improves training efficiency through asynchronous scheduling across coding, search, tool use, and workflow execution, enabling scalable learning from complex agent-environment interactions. Together, Ling-2.6 and Ring-2.6 provide a practical pathway toward efficient, scalable, and open agentic systems. We open-source all checkpoints in the 2.6 family to support further research and development in practical agentic intelligence.