Ling and Ring 2.6 Technischer Bericht: Effiziente und sofortige agentische Intelligenz im Billionen-Parameter-Maßstab

Zusammenfassung

Effiziente und skalierbare agentische Intelligenz erfordert Modelle, die sowohl reaktionsarme Latenz als auch starke Schlussfolgerungsfähigkeiten bieten können, während sie gleichzeitig praktikabel in Training, Bereitstellung und Einsatz bleiben. In diesem Bericht stellen wir Ling-2.6 und Ring-2.6 vor, eine Modellfamilie, die entwickelt wurde, um diese Herausforderung im großen Maßstab zu bewältigen. Ling-2.6 ist optimiert für die sofortige Antwortgenerierung und hohe Leistungsfähigkeit pro Ausgabetoken, während Ring-2.6 auf tiefere Schlussfolgerungen und fortgeschrittenere agentische Arbeitsabläufe zugeschnitten ist. Anstatt von Grund auf zu trainieren, verbessern wir das Basismodell Ling-2.0 durch architektonische Migrations-Vorabtrainings und groß angelegtes Nachtraining. Diese Verbesserung wird durch ein einheitliches Co-Design von Modellarchitektur, Optimierungszielen, Bereitstellungssystemen und agentischen Trainingsumgebungen geleitet, was Verbesserungen sowohl der Modellfähigkeiten als auch der Bereitstellungseffizienz ermöglicht. Auf architektonischer Ebene führen wir ein hybrides lineares Aufmerksamkeitsdesign ein, das Blitzaufmerksamkeit mit MLA integriert und so die Effizienz von langkontextbezogenem Training und Decodierung verbessert. Um die Token-Effizienz weiter zu steigern, optimieren wir die Leistungsfähigkeit pro Ausgabetoken durch evolutionäre Gedankenkette, linguistische Einheiten-Politikoptimierung, bidirektionale Präferenzausrichtung und Destillation der korrektesten und kürzesten Antwort. Für agentische Fähigkeiten schlagen wir KPop vor, ein Reinforcement-Learning-Framework, das entwickelt wurde, um stabiles Training von Ring-2.6-1T auf umgebungsbasierten Daten im großen Maßstab zu unterstützen. KPop verbessert die Trainingseffizienz durch asynchrone Planung über Codierung, Suche, Werkzeugnutzung und Arbeitsablaufausführung hinweg und ermöglicht so skalierbares Lernen aus komplexen Agent-Umgebungs-Interaktionen. Zusammen bieten Ling-2.6 und Ring-2.6 einen praktischen Weg zu effizienten, skalierbaren und offenen agentischen Systemen. Wir veröffentlichen alle Checkpoints der 2.6-Familie als Open Source, um weitere Forschung und Entwicklung in praktischer agentischer Intelligenz zu unterstützen.

English

Efficient and scalable agentic intelligence requires models that can deliver both low-latency responses and strong reasoning capabilities while remaining practical to train, serve, and deploy. In this report, we present Ling-2.6 and Ring-2.6, a family of models designed to address this challenge at scale. Ling-2.6 is optimized for instant response generation and high capability per output token, whereas Ring-2.6 is tailored for deeper reasoning and more advanced agentic workflows. Instead of training from scratch, we upgrade the Ling-2.0 base model through architectural migration pre-training and large-scale post-training. This upgrade is guided by a unified co-design of model architecture, optimization objectives, serving systems, and agent training environments, enabling improvements in both model capability and deployment efficiency. At the architectural level, we introduce a hybrid linear attention design that integrates Lightning Attention with MLA, improving the efficiency of long-context training and decoding. To further enhance token efficiency, we optimize capability per output token through Evolutionary Chain-of-Thought, Linguistic Unit Policy Optimization, bidirectional preference alignment, and shortest-correct-response distillation. For agentic capabilities, we propose KPop, a reinforcement learning framework designed to support stable training of Ring-2.6-1T on large-scale environment-grounded data. KPop improves training efficiency through asynchronous scheduling across coding, search, tool use, and workflow execution, enabling scalable learning from complex agent-environment interactions. Together, Ling-2.6 and Ring-2.6 provide a practical pathway toward efficient, scalable, and open agentic systems. We open-source all checkpoints in the 2.6 family to support further research and development in practical agentic intelligence.