Desempenho de medalhista de ouro na resolução de Geometria Olímpica com AlphaGeometry2
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2
February 5, 2025
Autores: Yuri Chervonyi, Trieu H. Trinh, Miroslav Olšák, Xiaomeng Yang, Hoang Nguyen, Marcelo Menegali, Junehyuk Jung, Vikas Verma, Quoc V. Le, Thang Luong
cs.AI
Resumo
Apresentamos o AlphaGeometry2, uma versão significativamente aprimorada do AlphaGeometry introduzido por Trinh et al. (2024), que agora superou a média de um medalhista de ouro na resolução de problemas de geometria olímpica. Para alcançar isso, primeiro estendemos a linguagem original do AlphaGeometry para lidar com problemas mais difíceis envolvendo movimentos de objetos e problemas contendo equações lineares de ângulos, razões e distâncias. Isso, juntamente com outras adições, melhorou consideravelmente a taxa de cobertura da linguagem AlphaGeometry nos problemas de geometria das Olimpíadas Internacionais de Matemática (IMO) de 2000 a 2024, de 66% para 88%. O processo de busca do AlphaGeometry2 também foi grandemente aprimorado por meio do uso da arquitetura Gemini para um melhor modelamento de linguagem, e um mecanismo inovador de compartilhamento de conhecimento que combina múltiplas árvores de busca. Juntamente com melhorias adicionais no mecanismo simbólico e na geração de dados sintéticos, aumentamos significativamente a taxa geral de resolução do AlphaGeometry2 para 84% para todos os problemas de geometria nos últimos 25 anos, em comparação com os 54% anteriores. O AlphaGeometry2 também fez parte do sistema que alcançou o padrão de medalha de prata na IMO 2024 https://dpmd.ai/imo-silver. Por último, relatamos o progresso em direção ao uso do AlphaGeometry2 como parte de um sistema totalmente automatizado que resolve de forma confiável problemas de geometria diretamente a partir de entradas em linguagem natural.
English
We present AlphaGeometry2, a significantly improved version of AlphaGeometry
introduced in Trinh et al. (2024), which has now surpassed an average gold
medalist in solving Olympiad geometry problems. To achieve this, we first
extend the original AlphaGeometry language to tackle harder problems involving
movements of objects, and problems containing linear equations of angles,
ratios, and distances. This, together with other additions, has markedly
improved the coverage rate of the AlphaGeometry language on International Math
Olympiads (IMO) 2000-2024 geometry problems from 66% to 88%. The search process
of AlphaGeometry2 has also been greatly improved through the use of Gemini
architecture for better language modeling, and a novel knowledge-sharing
mechanism that combines multiple search trees. Together with further
enhancements to the symbolic engine and synthetic data generation, we have
significantly boosted the overall solving rate of AlphaGeometry2 to 84% for
all geometry problems over the last 25 years, compared to 54%
previously. AlphaGeometry2 was also part of the system that achieved
silver-medal standard at IMO 2024 https://dpmd.ai/imo-silver. Last but not
least, we report progress towards using AlphaGeometry2 as a part of a fully
automated system that reliably solves geometry problems directly from natural
language input.Summary
AI-Generated Summary