T-pro 2.0: Эффективная российская гибридная модель рассуждений и среда для экспериментов
T-pro 2.0: An Efficient Russian Hybrid-Reasoning Model and Playground
December 11, 2025
Авторы: Dmitrii Stoianov, Danil Taranets, Olga Tsymboi, Ramil Latypov, Almaz Dautov, Vladislav Kruglikov, Nikita Surkov, German Abramov, Pavel Gein, Dmitry Abulkhanov, Mikhail Gashkov, Viktor Zelenkovskiy, Artem Batalov, Aleksandr Medvedev, Anatolii Potapov
cs.AI
Аннотация
Мы представляем T-pro 2.0 — открытую русскоязычную большую языковую модель (LLM) для гибридного логического вывода и эффективного инференса. Модель поддерживает прямой ответ и генерацию цепочек рассуждений, используя токенизатор с высокой плотностью кириллических символов и адаптированный конвейер спекулятивного декодирования EAGLE для снижения задержек. Для обеспечения воспроизводимости и расширяемости исследований мы публикуем веса модели, инструктивный корпус T-Wix объемом 500 тыс. примеров, бенчмарк логических рассуждений T-Math и веса EAGLE на платформе Hugging Face. Эти ресурсы позволяют исследовать русскоязычные рассуждения, а также расширять и адаптировать как модель, так и конвейер вывода. Публичная веб-демонстрация демонстрирует режимы с рассуждениями и без, иллюстрируя ускорение работы нашего стека инференса в различных областях. Таким образом, T-pro 2.0 служит доступной открытой системой для создания и оценки эффективных практических приложений на основе русскоязычных LLM.
English
We introduce T-pro 2.0, an open-weight Russian LLM for hybrid reasoning and efficient inference. The model supports direct answering and reasoning-trace generation, using a Cyrillic-dense tokenizer and an adapted EAGLE speculative-decoding pipeline to reduce latency. To enable reproducible and extensible research, we release the model weights, the T-Wix 500k instruction corpus, the T-Math reasoning benchmark, and the EAGLE weights on Hugging Face. These resources allow users to study Russian-language reasoning and to extend or adapt both the model and the inference pipeline. A public web demo exposes reasoning and non-reasoning modes and illustrates the speedups achieved by our inference stack across domains. T-pro 2.0 thus serves as an accessible open system for building and evaluating efficient, practical Russian LLM applications.