Rapport technique Qwen2.5-CoderQwen2.5-Coder Technical Report
Dans ce rapport, nous prĂ©sentons la sĂ©rie Qwen2.5-Coder, une mise Ă niveau significative de son prĂ©dĂ©cesseur, CodeQwen1.5. Cette sĂ©rie comprend deux modĂšles : Qwen2.5-Coder-1.5B et Qwen2.5-Coder-7B. En tant que modĂšle spĂ©cifique au code, Qwen2.5-Coder est construit sur l'architecture Qwen2.5 et continue d'ĂȘtre prĂ©-entraĂźnĂ© sur un vaste corpus de plus de 5,5 billions de jetons. GrĂące Ă un nettoyage minutieux des donnĂ©es, Ă une gĂ©nĂ©ration de donnĂ©es synthĂ©tiques Ă©volutive et Ă un mĂ©lange Ă©quilibrĂ© des donnĂ©es, Qwen2.5-Coder dĂ©montre d'impressionnantes capacitĂ©s de gĂ©nĂ©ration de code tout en conservant une polyvalence gĂ©nĂ©rale. Le modĂšle a Ă©tĂ© Ă©valuĂ© sur un large Ă©ventail de tĂąches liĂ©es au code, atteignant des performances de pointe (SOTA) sur plus de 10 rĂ©fĂ©rences, y compris la gĂ©nĂ©ration de code, l'achĂšvement, le raisonnement et la rĂ©paration, surpassant systĂ©matiquement des modĂšles plus grands de la mĂȘme taille. Nous pensons que la sortie de la sĂ©rie Qwen2.5-Coder repoussera non seulement les limites de la recherche en intelligence du code, mais encouragera Ă©galement, grĂące Ă sa licence permissive, une adoption plus large par les dĂ©veloppeurs dans des applications du monde rĂ©el.