AlphaGeometry2を使用して、オリンピアードの幾何学問題を解決する際の金メダリストのパフォーマンス
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
著者: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
要旨
私たちは、Trinhら(2024)によって導入されたAlphaGeometryの大幅に改良されたバージョンであるAlphaGeometry2を発表します。このAlphaGeometry2は、オリンピアードの幾何学問題を解く際に平均的な金メダリストを上回るようになりました。このために、ますます難解な問題、物体の移動を含む問題、角度、比率、距離の線形方程式を含む問題に対応できるように、元のAlphaGeometry言語を拡張しました。これに加え、その他の追加機能と共に、AlphaGeometry言語の国際数学オリンピアード(IMO)2000-2024の幾何学問題に対するカバレッジ率を66%から88%に著しく向上させました。AlphaGeometry2の探索プロセスも、Geminiアーキテクチャを使用して言語モデリングを向上させ、複数の探索木を組み合わせた新しい知識共有メカニズムを導入することで大幅に改善されています。さらに、象徴エンジンと合成データ生成のさらなる強化を行った結果、過去25年間のすべての幾何学問題に対するAlphaGeometry2の解決率は、以前の54%から84%に大幅に向上しました。AlphaGeometry2は、IMO 2024で銀メダル基準を達成したシステムの一部でもありました。最後に、AlphaGeometry2を自然言語入力から直接幾何学問題を信頼性を持って解決する完全自動化システムの一部として使用する方向に進展していることを報告します。
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary