Qwen2.5-Coder 技術報告Qwen2.5-Coder Technical Report
在本報告中,我們介紹了Qwen2.5-Coder系列,這是其前身CodeQwen1.5的重大升級。該系列包括兩個模型:Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B。作為一個專注於程式碼的模型,Qwen2.5-Coder基於Qwen2.5架構構建,並繼續在超過5.5兆個標記的龐大語料庫上進行預訓練。通過細緻的數據清理、可擴展的合成數據生成和平衡的數據混合,Qwen2.5-Coder展現出令人印象深刻的程式碼生成能力,同時保留了通用的多功能性。該模型已在廣泛的與程式碼相關的任務上進行評估,在超過10個基準測試中實現了最先進的性能,包括程式碼生成、完成、推理和修復,在相同模型大小的情況下始終優於更大的模型。我們相信,Qwen2.5-Coder系列的推出不僅將推動程式碼智能研究的界限,還將通過其寬鬆的許可,鼓勵開發人員在實際應用中更廣泛地採用。