Ежедневно отобранные исследовательские статьи по ИИ с переводами
Последние достижения в области больших языковых моделей (LLM) сместили границы исследований от решения головоломок к научному уровню рассуждений — тому, который необходим для решения задач, ответы на которые должны соответствовать законам природы, а не просто удовлетворять критериям оценки. Физика является наиболее строгим испытанием этого перехода, поскольку она связывает символы с реальностью на фундаментальном уровне, выступая краеугольным камнем большинства современных технологий. В данной работе мы продвигаем исследования в области физики, разрабатывая большие языковые модели с исключительными способностями к физическим рассуждениям, особенно эффективные в решении задач уровня олимпиад. Мы представляем P1 — семейство открытых моделей для физических рассуждений, полностью обученных с использованием обучения с подкреплением (RL). Среди них P1-235B-A22B является первой открытой моделью, демонстрирующей уровень, соответствующий золотой медали на последней Международной физической олимпиаде (IPhO 2025), и завоевывающей 12 золотых медалей из 13 международных и региональных физических соревнований в 2024/2025 годах. P1-30B-A3B также превосходит почти все другие открытые модели на IPhO 2025, получая серебряную медаль. Дополненная агентной платформой PhysicsMinions, модель P1-235B-A22B+PhysicsMinions занимает первое место на IPhO 2025 и демонстрирует наивысший средний балл на 13 физических соревнованиях. Помимо физики, модели P1 также показывают выдающиеся результаты в других задачах, требующих рассуждений, таких как математика и программирование, что свидетельствует о высокой обобщающей способности серии P1.