알파지오메트리2로 올림피아드 기하 문제를 해결한 금메달 수상작
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
저자: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
초록
우리는 Trinh et al. (2024)에서 소개된 AlphaGeometry의 크게 향상된 버전인 AlphaGeometry2를 제시합니다. 이 버전은 이제 올림피아드 기하학 문제를 해결하는 평균 금메달리스트를 능가했습니다. 이를 달성하기 위해 우리는 먼저 원래의 AlphaGeometry 언어를 확장하여 물체의 이동과 각도, 비율, 거리의 선형 방정식을 포함하는 더 어려운 문제에 대처하도록 했습니다. 이것은 다른 추가 요소와 함께 함께하여, AlphaGeometry 언어의 국제 수학 올림피아드 (IMO) 2000-2024 기하학 문제에 대한 커버리지 비율을 66%에서 88%로 현저히 향상시켰습니다. AlphaGeometry2의 검색 과정은 또한 Gemini 아키텍처를 사용하여 언어 모델링을 개선하고, 여러 검색 트리를 결합하는 혁신적인 지식 공유 메커니즘을 통해 크게 향상되었습니다. 심볼릭 엔진 및 합성 데이터 생성에 대한 추가 개선과 함께, 지난 25년 동안 모든 기하학 문제에 대한 AlphaGeometry2의 전체 해결 비율을 84%로 상당히 향상시켰습니다. 이는 이전의 54%와 비교했을 때 큰 향상입니다. AlphaGeometry2는 또한 IMO 2024에서 은메달 수준을 달성한 시스템의 일부였습니다. 마지막으로, 우리는 AlphaGeometry2를 자연어 입력에서 직접 기하학 문제를 신뢰성 있게 해결하는 완전 자동화된 시스템의 일부로 사용하기 위한 진전을 보고합니다.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary