Phi-4 技術報告Phi-4 Technical Report
我們提出 phi-4,一個擁有 140 億參數的語言模型,其訓練配方主要著重於數據質量。與大多數語言模型不同,其預訓練主要基於有機數據來源,如網絡內容或代碼,phi-4 策略性地在整個訓練過程中納入合成數據。儘管 Phi 系列中先前的模型主要提煉了教師模型(特別是 GPT-4)的能力,phi-4 在 STEM 專注的問答能力上顯著超越其教師模型,這證明我們的數據生成和後訓練技術超越了提煉。儘管對 phi-3 架構進行了最小的更改,phi-4 由於數據、訓練課程的改進以及後訓練方案的創新,在相對於其大小的情況下實現了強大的性能,特別是在著眼於推理的基準測試上。