ChatPaper.aiChatPaper

알파지오메트리2로 올림피아드 기하 문제를 해결한 금메달 수상작

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

February 5, 2025
저자: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI

초록

우리는 Trinh et al. (2024)에서 소개된 AlphaGeometry의 크게 향상된 버전인 AlphaGeometry2를 제시합니다. 이 버전은 이제 올림피아드 기하학 문제를 해결하는 평균 금메달리스트를 능가했습니다. 이를 달성하기 위해 우리는 먼저 원래의 AlphaGeometry 언어를 확장하여 물체의 이동과 각도, 비율, 거리의 선형 방정식을 포함하는 더 어려운 문제에 대처하도록 했습니다. 이것은 다른 추가 요소와 함께 함께하여, AlphaGeometry 언어의 국제 수학 올림피아드 (IMO) 2000-2024 기하학 문제에 대한 커버리지 비율을 66%에서 88%로 현저히 향상시켰습니다. AlphaGeometry2의 검색 과정은 또한 Gemini 아키텍처를 사용하여 언어 모델링을 개선하고, 여러 검색 트리를 결합하는 혁신적인 지식 공유 메커니즘을 통해 크게 향상되었습니다. 심볼릭 엔진 및 합성 데이터 생성에 대한 추가 개선과 함께, 지난 25년 동안 모든 기하학 문제에 대한 AlphaGeometry2의 전체 해결 비율을 84%로 상당히 향상시켰습니다. 이는 이전의 54%와 비교했을 때 큰 향상입니다. AlphaGeometry2는 또한 IMO 2024에서 은메달 수준을 달성한 시스템의 일부였습니다. 마지막으로, 우리는 AlphaGeometry2를 자연어 입력에서 직접 기하학 문제를 신뢰성 있게 해결하는 완전 자동화된 시스템의 일부로 사용하기 위한 진전을 보고합니다.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry introduced in Trinh et al. (2024), which has now surpassed an average gold medalist in solving Olympiad geometry problems. To achieve this, we first extend the original AlphaGeometry language to tackle harder problems involving movements of objects, and problems containing linear equations of angles, ratios, and distances. This, together with other additions, has markedly improved the coverage rate of the AlphaGeometry language on International Math Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process of AlphaGeometry2 has also been greatly improved through the use of Gemini architecture for better language modeling, and a novel knowledge-sharing mechanism that combines multiple search trees. Together with further enhancements to the symbolic engine and synthetic data generation, we have significantly boosted the overall solving rate of AlphaGeometry2 to 84% for all geometry problems over the last 25 years, compared to 54% previously. AlphaGeometry2 was also part of the system that achieved silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not least, we report progress towards using AlphaGeometry2 as a part of a fully automated system that reliably solves geometry problems directly from natural language input.

Summary

AI-Generated Summary

PDF445February 7, 2025