Informe Técnico Qwen2.5-CoderQwen2.5-Coder Technical Report
En este informe, presentamos la serie Qwen2.5-Coder, una actualización significativa de su predecesor, CodeQwen1.5. Esta serie incluye dos modelos: Qwen2.5-Coder-1.5B y Qwen2.5-Coder-7B. Como un modelo específico para código, Qwen2.5-Coder se basa en la arquitectura Qwen2.5 y continúa preentrenado en un vasto corpus de más de 5.5 billones de tokens. A través de una meticulosa limpieza de datos, generación escalable de datos sintéticos y mezcla equilibrada de datos, Qwen2.5-Coder demuestra impresionantes capacidades de generación de código manteniendo su versatilidad general. El modelo ha sido evaluado en una amplia gama de tareas relacionadas con el código, logrando un rendimiento de última generación (SOTA) en más de 10 benchmarks, incluyendo generación de código, completado, razonamiento y reparación, superando consistentemente a modelos más grandes del mismo tamaño. Creemos que el lanzamiento de la serie Qwen2.5-Coder no solo empujará los límites de la investigación en inteligencia de código, sino que también, a través de su licencia permisiva, fomentará una adopción más amplia por parte de los desarrolladores en aplicaciones del mundo real.