Dagelijks geselecteerde AI onderzoekspapers met vertalingen
Recente vooruitgang in grote taalmodelen (LLM's) heeft de grens verlegd van puzzeloplossen naar wetenschappelijk redeneren van hoog niveau – het soort redeneren dat nodig is om problemen aan te pakken waarvan de antwoorden tegen de natuur moeten worden afgewogen, en niet slechts aan een rubric moeten voldoen. Natuurkunde vormt de scherpste toets voor deze verschuiving, omdat het symbolen op een fundamentele manier aan de werkelijkheid bindt en fungeert als hoeksteen van de meeste moderne technologieën. In dit werk slagen we erin het natuurkundeonderzoek vooruit te helpen door grote taalmodelen te ontwikkelen met uitzonderlijke redeneervaardigheden in de natuurkunde, die vooral uitblinken in het oplossen van Olympiade-niveau natuurkundeproblemen. We introduceren P1, een familie van open-source natuurkunde-redeneermodellen die volledig zijn getraind via reinforcement learning (RL). Onder hen is P1-235B-A22B het eerste open-source model met een gouden-medailleprestatie op de laatste Internationale Natuurkunde Olympiade (IPhO 2025), en wint het 12 gouden medailles uit 13 internationale/regionale natuurkundewedstrijden in 2024/2025. P1-30B-A3B overtreft ook bijna alle andere open-source modellen op IPhO 2025 en behaalt een zilveren medaille. Verder uitgerust met een agentisch raamwerk, PhysicsMinions, behaalt P1-235B-A22B+PhysicsMinions de algehele eerste plaats op IPhO 2025 en scoort het het hoogste gemiddelde over de 13 natuurkundewedstrijden. Naast natuurkunde tonen de P1-modellen ook uitstekende prestaties op andere redeneertaken zoals wiskunde en programmeren, wat de grote generaliseerbaarheid van de P1-serie aantoont.