Линг и Ринг 2.6 Технический отчет: Эффективный и мгновенный агентный интеллект в масштабе триллиона параметров

Аннотация

Эффективный и масштабируемый агентный интеллект требует моделей, способных обеспечивать как низкую задержку ответа, так и высокие способности к рассуждению, оставаясь при этом практичными в обучении, развертывании и эксплуатации. В данном отчете мы представляем Ling-2.6 и Ring-2.6 — семейство моделей, разработанных для решения этой задачи в масштабе. Ling-2.6 оптимизирована для мгновенной генерации ответов и высокой производительности на единицу выходного токена, тогда как Ring-2.6 ориентирована на более глубокие рассуждения и более продвинутые агентные сценарии. Вместо обучения с нуля мы модернизируем базовую модель Ling-2.0 путем миграционного пре-тренинга архитектуры и крупномасштабного пост-тренинга. Эта модернизация осуществляется на основе единого совместного проектирования архитектуры модели, целей оптимизации, систем обслуживания и сред обучения агентов, что позволяет добиться улучшений как в производительности модели, так и в эффективности развертывания. На архитектурном уровне мы внедряем гибридный дизайн линейного внимания, объединяющий Lightning Attention и MLA, что повышает эффективность обучения и декодирования в условиях длинного контекста. Для дальнейшего повышения токенной эффективности мы оптимизируем производительность на единицу выходного токена с помощью эволюционной цепочки рассуждений, оптимизации политики языковых единиц, двунаправленного выравнивания предпочтений и дистилляции кратчайших корректных ответов. Для агентных способностей мы предлагаем KPop — фреймворк обучения с подкреплением, предназначенный для обеспечения стабильного обучения Ring-2.6-1T на крупномасштабных данных, основанных на взаимодействии со средой. KPop повышает эффективность обучения за счет асинхронного планирования задач кодирования, поиска, использования инструментов и выполнения рабочих процессов, что обеспечивает масштабируемое обучение на основе сложных взаимодействий агента со средой. Вместе Ling-2.6 и Ring-2.6 предоставляют практический путь к эффективным, масштабируемым и открытым агентным системам. Мы публикуем в открытом доступе все контрольные точки семейства 2.6, чтобы поддержать дальнейшие исследования и разработки в области практического агентного интеллекта.

English

Efficient and scalable agentic intelligence requires models that can deliver both low-latency responses and strong reasoning capabilities while remaining practical to train, serve, and deploy. In this report, we present Ling-2.6 and Ring-2.6, a family of models designed to address this challenge at scale. Ling-2.6 is optimized for instant response generation and high capability per output token, whereas Ring-2.6 is tailored for deeper reasoning and more advanced agentic workflows. Instead of training from scratch, we upgrade the Ling-2.0 base model through architectural migration pre-training and large-scale post-training. This upgrade is guided by a unified co-design of model architecture, optimization objectives, serving systems, and agent training environments, enabling improvements in both model capability and deployment efficiency. At the architectural level, we introduce a hybrid linear attention design that integrates Lightning Attention with MLA, improving the efficiency of long-context training and decoding. To further enhance token efficiency, we optimize capability per output token through Evolutionary Chain-of-Thought, Linguistic Unit Policy Optimization, bidirectional preference alignment, and shortest-correct-response distillation. For agentic capabilities, we propose KPop, a reinforcement learning framework designed to support stable training of Ring-2.6-1T on large-scale environment-grounded data. KPop improves training efficiency through asynchronous scheduling across coding, search, tool use, and workflow execution, enabling scalable learning from complex agent-environment interactions. Together, Ling-2.6 and Ring-2.6 provide a practical pathway toward efficient, scalable, and open agentic systems. We open-source all checkpoints in the 2.6 family to support further research and development in practical agentic intelligence.