Goldmedaillenleistung beim Lösen von Olympiade-Geometrie mit AlphaGeometry2
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
Autoren: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
Zusammenfassung
Wir präsentieren AlphaGeometry2, eine signifikant verbesserte Version von AlphaGeometry, die in Trinh et al. (2024) eingeführt wurde und nun einen durchschnittlichen Goldmedaillengewinner bei der Lösung von olympischen Geometrieaufgaben übertroffen hat. Um dies zu erreichen, haben wir zunächst die ursprüngliche AlphaGeometry-Sprache erweitert, um schwierigere Probleme zu bewältigen, die Bewegungen von Objekten sowie Probleme mit linearen Gleichungen von Winkeln, Verhältnissen und Abständen beinhalten. Dies hat zusammen mit anderen Ergänzungen die Abdeckungsrate der AlphaGeometry-Sprache bei den Geometrieaufgaben der Internationalen Mathematik-Olympiaden (IMO) von 2000 bis 2024 von 66 % auf 88 % deutlich verbessert. Der Suchprozess von AlphaGeometry2 wurde auch erheblich verbessert durch die Verwendung der Gemini-Architektur für eine bessere Sprachmodellierung und einen neuartigen Wissensaustauschmechanismus, der mehrere Suchbäume kombiniert. Zusammen mit weiteren Verbesserungen am symbolischen Motor und der synthetischen Datengenerierung haben wir die Gesamtlösungsrate von AlphaGeometry2 für alle Geometrieaufgaben der letzten 25 Jahre signifikant auf 84 % gesteigert, verglichen mit zuvor 54 %. AlphaGeometry2 war auch Teil des Systems, das den Silbermedaillenstandard bei der IMO 2024 erreicht hat. Zuletzt berichten wir über Fortschritte bei der Verwendung von AlphaGeometry2 als Teil eines vollautomatischen Systems, das Geometrieaufgaben zuverlässig direkt aus natürlicher Sprache löst.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary