Gouden-medailleprestatie bij het oplossen van Olympiade-geometrie met AlphaGeometry2.
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
Auteurs: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
Samenvatting
Wij presenteren AlphaGeometry2, een aanzienlijk verbeterde versie van AlphaGeometry geïntroduceerd in Trinh et al. (2024), die nu een gemiddelde gouden medaillewinnaar heeft overtroffen in het oplossen van Olympische meetkundeproblemen. Om dit te bereiken, breiden we eerst de oorspronkelijke AlphaGeometry-taal uit om moeilijkere problemen aan te pakken die bewegingen van objecten omvatten, en problemen met lineaire vergelijkingen van hoeken, verhoudingen en afstanden. Dit, samen met andere toevoegingen, heeft aanzienlijk de dekkingsgraad van de AlphaGeometry-taal voor meetkundeproblemen van de International Math Olympiads (IMO) 2000-2024 verbeterd van 66% naar 88%. Het zoekproces van AlphaGeometry2 is ook aanzienlijk verbeterd door het gebruik van de Gemini-architectuur voor een betere taalmodellering, en een nieuw kennisdelingsmechanisme dat meerdere zoekbomen combineert. Samen met verdere verbeteringen aan de symbolische engine en synthetische gegevensgeneratie hebben we de algehele oplossingsgraad van AlphaGeometry2 aanzienlijk verhoogd tot 84% voor alle meetkundeproblemen van de afgelopen 25 jaar, in vergelijking met 54% eerder. AlphaGeometry2 maakte ook deel uit van het systeem dat de standaard voor de zilveren medaille behaalde op IMO 2024 https://dpmd.ai/imo-zilver. Last but not least, rapporteren we voortgang in het gebruik van AlphaGeometry2 als onderdeel van een volledig geautomatiseerd systeem dat meetkundeproblemen betrouwbaar oplost rechtstreeks vanuit natuurlijke taalinvoer.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary