Phi-4 テクニカルレポートPhi-4 Technical Report
phi-4は、データ品質に焦点を当てたトレーニングレシピで開発された140億パラメータの言語モデルであり、我々はそれを紹介する。通常の言語モデルとは異なり、事前トレーニングは主にウェブコンテンツやコードなどのオーガニックデータソースに基づいているが、phi-4は戦略的に合成データをトレーニングプロセス全体に取り入れている。Phiファミリーの以前のモデルは、主に教師モデル(具体的にはGPT-4)の能力を抽出していたが、phi-4はSTEMに焦点を当てたQA能力において教師モデルを大幅に上回り、我々のデータ生成およびポストトレーニング技術が抽出を超えている証拠を提供している。phi-3アーキテクチャにほとんど変更を加えながらも、phi-4はサイズに対して強力なパフォーマンスを達成しており、特に推論に焦点を当てたベンチマークにおいて、改善されたデータ、トレーニングカリキュラム、およびポストトレーニングスキームによって優れた成績を収めている。