ChatPaper.aiChatPaper

Gouden-medailleprestatie bij het oplossen van Olympiade-geometrie met AlphaGeometry2.

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

February 5, 2025
Auteurs: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI

Samenvatting

Wij presenteren AlphaGeometry2, een aanzienlijk verbeterde versie van AlphaGeometry geïntroduceerd in Trinh et al. (2024), die nu een gemiddelde gouden medaillewinnaar heeft overtroffen in het oplossen van Olympische meetkundeproblemen. Om dit te bereiken, breiden we eerst de oorspronkelijke AlphaGeometry-taal uit om moeilijkere problemen aan te pakken die bewegingen van objecten omvatten, en problemen met lineaire vergelijkingen van hoeken, verhoudingen en afstanden. Dit, samen met andere toevoegingen, heeft aanzienlijk de dekkingsgraad van de AlphaGeometry-taal voor meetkundeproblemen van de International Math Olympiads (IMO) 2000-2024 verbeterd van 66% naar 88%. Het zoekproces van AlphaGeometry2 is ook aanzienlijk verbeterd door het gebruik van de Gemini-architectuur voor een betere taalmodellering, en een nieuw kennisdelingsmechanisme dat meerdere zoekbomen combineert. Samen met verdere verbeteringen aan de symbolische engine en synthetische gegevensgeneratie hebben we de algehele oplossingsgraad van AlphaGeometry2 aanzienlijk verhoogd tot 84% voor alle meetkundeproblemen van de afgelopen 25 jaar, in vergelijking met 54% eerder. AlphaGeometry2 maakte ook deel uit van het systeem dat de standaard voor de zilveren medaille behaalde op IMO 2024 https://dpmd.ai/imo-zilver. Last but not least, rapporteren we voortgang in het gebruik van AlphaGeometry2 als onderdeel van een volledig geautomatiseerd systeem dat meetkundeproblemen betrouwbaar oplost rechtstreeks vanuit natuurlijke taalinvoer.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry introduced in Trinh et al. (2024), which has now surpassed an average gold medalist in solving Olympiad geometry problems. To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances. This, together with other additions, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that combines multiple search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2 to 84% for all geometry problems over the last 25 years, compared to 54% previously. AlphaGeometry2 was also part of the system that achieved silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not least, we report progress towards using AlphaGeometry2 as a part of a fully automated system that reliably solves geometry problems directly from natural language input.

Summary

AI-Generated Summary

PDF445February 7, 2025