ChatPaper.aiChatPaper

Goldmedaillenleistung beim Lösen von Olympiade-Geometrie mit AlphaGeometry2

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

February 5, 2025
Autoren: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI

Zusammenfassung

Wir präsentieren AlphaGeometry2, eine signifikant verbesserte Version von AlphaGeometry, die in Trinh et al. (2024) eingeführt wurde und nun einen durchschnittlichen Goldmedaillengewinner bei der Lösung von olympischen Geometrieaufgaben übertroffen hat. Um dies zu erreichen, haben wir zunächst die ursprüngliche AlphaGeometry-Sprache erweitert, um schwierigere Probleme zu bewältigen, die Bewegungen von Objekten sowie Probleme mit linearen Gleichungen von Winkeln, Verhältnissen und Abständen beinhalten. Dies hat zusammen mit anderen Ergänzungen die Abdeckungsrate der AlphaGeometry-Sprache bei den Geometrieaufgaben der Internationalen Mathematik-Olympiaden (IMO) von 2000 bis 2024 von 66 % auf 88 % deutlich verbessert. Der Suchprozess von AlphaGeometry2 wurde auch erheblich verbessert durch die Verwendung der Gemini-Architektur für eine bessere Sprachmodellierung und einen neuartigen Wissensaustauschmechanismus, der mehrere Suchbäume kombiniert. Zusammen mit weiteren Verbesserungen am symbolischen Motor und der synthetischen Datengenerierung haben wir die Gesamtlösungsrate von AlphaGeometry2 für alle Geometrieaufgaben der letzten 25 Jahre signifikant auf 84 % gesteigert, verglichen mit zuvor 54 %. AlphaGeometry2 war auch Teil des Systems, das den Silbermedaillenstandard bei der IMO 2024 erreicht hat. Zuletzt berichten wir über Fortschritte bei der Verwendung von AlphaGeometry2 als Teil eines vollautomatischen Systems, das Geometrieaufgaben zuverlässig direkt aus natürlicher Sprache löst.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry introduced in Trinh et al. (2024), which has now surpassed an average gold medalist in solving Olympiad geometry problems. To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances. This, together with other additions, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that combines multiple search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2 to 84% for all geometry problems over the last 25 years, compared to 54% previously. AlphaGeometry2 was also part of the system that achieved silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not least, we report progress towards using AlphaGeometry2 as a part of a fully automated system that reliably solves geometry problems directly from natural language input.

Summary

AI-Generated Summary

PDF445February 7, 2025