Qwen2.5-Coder テクニカルレポートQwen2.5-Coder Technical Report
このレポートでは、先行モデルであるCodeQwen1.5からの大幅なアップグレードであるQwen2.5-Coderシリーズを紹介します。このシリーズには、Qwen2.5-Coder-1.5BとQwen2.5-Coder-7Bの2つのモデルが含まれています。コードに特化したモデルであるQwen2.5-Coderは、Qwen2.5アーキテクチャを基盤に構築され、5.5兆以上のトークンからなる膨大なコーパスで事前学習されています。緻密なデータクリーニング、スケーラブルな合成データ生成、バランスの取れたデータの混合を通じて、Qwen2.5-Coderは印象的なコード生成能力を示し、一般的な汎用性を保持しています。このモデルは、コード生成、補完、推論、修復を含む10以上のベンチマークで、同じモデルサイズの大きなモデルを一貫して上回る、最先端のパフォーマンスを達成しました。Qwen2.5-Coderシリーズのリリースにより、コードインテリジェンスの研究の限界を押し広げるだけでなく、許容的なライセンスによって開発者による実世界のアプリケーションでのより広範な採用を促進すると考えています。