Relazione Tecnica Qwen2.5-CoderQwen2.5-Coder Technical Report
In questo rapporto, presentiamo la serie Qwen2.5-Coder, un significativo aggiornamento rispetto al suo predecessore, CodeQwen1.5. Questa serie include due modelli: Qwen2.5-Coder-1.5B e Qwen2.5-Coder-7B. Come modello specifico per il codice, Qwen2.5-Coder si basa sull'architettura Qwen2.5 e continua il preaddestramento su un vasto corpus di oltre 5,5 trilioni di token. Attraverso un'attenta pulizia dei dati, la generazione scalabile di dati sintetici e un bilanciato mixing dei dati, Qwen2.5-Coder dimostra impressionanti capacità di generazione di codice pur mantenendo una versatilità generale. Il modello è stato valutato su una vasta gamma di compiti correlati al codice, raggiungendo prestazioni all'avanguardia su più di 10 benchmark, inclusa la generazione, il completamento, il ragionamento e la riparazione del codice, superando costantemente modelli più grandi della stessa dimensione. Crediamo che il rilascio della serie Qwen2.5-Coder non solo spingerà i confini della ricerca nell'intelligenza del codice, ma anche, attraverso la sua licenza permissiva, incoraggerà una più ampia adozione da parte degli sviluppatori nelle applicazioni del mondo reale.