ChatPaper.aiChatPaper

AlphaGeometry2を使用して、オリンピアードの幾何学問題を解決する際の金メダリストのパフォーマンス

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

February 5, 2025
著者: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI

要旨

私たちは、Trinhら(2024)によって導入されたAlphaGeometryの大幅に改良されたバージョンであるAlphaGeometry2を発表します。このAlphaGeometry2は、オリンピアードの幾何学問題を解く際に平均的な金メダリストを上回るようになりました。このために、ますます難解な問題、物体の移動を含む問題、角度、比率、距離の線形方程式を含む問題に対応できるように、元のAlphaGeometry言語を拡張しました。これに加え、その他の追加機能と共に、AlphaGeometry言語の国際数学オリンピアード(IMO)2000-2024の幾何学問題に対するカバレッジ率を66%から88%に著しく向上させました。AlphaGeometry2の探索プロセスも、Geminiアーキテクチャを使用して言語モデリングを向上させ、複数の探索木を組み合わせた新しい知識共有メカニズムを導入することで大幅に改善されています。さらに、象徴エンジンと合成データ生成のさらなる強化を行った結果、過去25年間のすべての幾何学問題に対するAlphaGeometry2の解決率は、以前の54%から84%に大幅に向上しました。AlphaGeometry2は、IMO 2024で銀メダル基準を達成したシステムの一部でもありました。最後に、AlphaGeometry2を自然言語入力から直接幾何学問題を信頼性を持って解決する完全自動化システムの一部として使用する方向に進展していることを報告します。
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry introduced in Trinh et al. (2024), which has now surpassed an average gold medalist in solving Olympiad geometry problems. To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances. This, together with other additions, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that combines multiple search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2 to 84% for all geometry problems over the last 25 years, compared to 54% previously. AlphaGeometry2 was also part of the system that achieved silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not least, we report progress towards using AlphaGeometry2 as a part of a fully automated system that reliably solves geometry problems directly from natural language input.

Summary

AI-Generated Summary

PDF445February 7, 2025