Технический отчет по Qwen2.5-CoderQwen2.5-Coder Technical Report
В данном отчете мы представляем серию Qwen2.5-Coder, значительное обновление по сравнению с предыдущей версией CodeQwen1.5. Эта серия включает две модели: Qwen2.5-Coder-1.5B и Qwen2.5-Coder-7B. Как модель, специализированная на коде, Qwen2.5-Coder построена на архитектуре Qwen2.5 и продолжает обучение на огромном корпусе из более чем 5,5 триллиона токенов. Благодаря тщательной очистке данных, масштабируемому созданию синтетических данных и сбалансированному смешиванию данных, Qwen2.5-Coder демонстрирует впечатляющие возможности генерации кода, сохраняя при этом общую универсальность. Модель была оценена на широком спектре задач, связанных с кодом, достигая передовых показателей (SOTA) по более чем 10 бенчмаркам, включая генерацию, завершение, рассуждения и восстановление кода, последовательно превосходя более крупные модели того же размера. Мы считаем, что выпуск серии Qwen2.5-Coder не только расширит границы исследований в области интеллекта кода, но также, благодаря своей лицензии с открытым исходным кодом, поощрит более широкое принятие разработчиками в реальных приложениях.