Phi-4 技术报告Phi-4 Technical Report
我们介绍 phi-4,这是一个拥有 140 亿参数的语言模型,其训练配方主要关注数据质量。与大多数语言模型不同,其预训练主要基于诸如网络内容或代码等有机数据源的模型不同,phi-4 在整个训练过程中策略性地融入了合成数据。虽然 Phi 系列中以往的模型主要提炼了教师模型(具体来说是 GPT-4)的能力,但 phi-4 在面向 STEM 领域的问答能力上显著超越了其教师模型,这证明了我们的数据生成和后训练技术超越了简单提炼。尽管 phi-4 在架构上的改变很少,但由于改进的数据、训练课程以及后训练方案的创新,phi-4 相对于其规模取得了强大的性能,尤其是在侧重推理的基准测试上。