PhononBench: Um Benchmark em Larga Escala Baseado em Fónons para Estabilidade Dinâmica na Geração de Cristais
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation
December 24, 2025
Autores: Xiao-Qi Han, Ze-Feng Gao, Peng-Jie Guo, Zhong-Yi Lu
cs.AI
Resumo
Neste trabalho, apresentamos o PhononBench, o primeiro benchmark em larga escala para estabilidade dinâmica em cristais gerados por IA. Utilizando o potencial interatômico MatterSim, recentemente desenvolvido, que alcança precisão ao nível do DFT em previsões de fónons para mais de 10.000 materiais, o PhononBench permite cálculos eficientes de fónons em larga escala e análise de estabilidade dinâmica para 108.843 estruturas cristalinas geradas por seis modelos líderes de geração de cristais. O PhononBench revela uma limitação generalizada dos modelos generativos atuais em garantir a estabilidade dinâmica: a taxa média de estabilidade dinâmica em todas as estruturas geradas é de apenas 25,83%, com o modelo de melhor desempenho, o MatterGen, atingindo apenas 41,0%. Estudos de caso adicionais mostram que, na geração direcionada por propriedades – ilustrada aqui pelo condicionamento do *band gap* com o MatterGen – a taxa de estabilidade dinâmica permanece tão baixa quanto 23,5%, mesmo na condição ótima de *band gap* de 0,5 eV. Na geração controlada por grupo espacial, cristais com simetria mais elevada exibem melhor estabilidade (por exemplo, sistemas cúbicos atingem taxas de até 49,2%), mas a estabilidade média em todas as gerações controladas é de apenas 34,4%. Um resultado adicional importante deste estudo é a identificação de 28.119 estruturas cristalinas que são fononicamente estáveis em toda a zona de Brillouin, fornecendo um conjunto substancial de candidatos confiáveis para futura exploração de materiais. Ao estabelecer o primeiro benchmark de estabilidade dinâmica em larga escala, este trabalho destaca sistematicamente as limitações atuais dos modelos de geração de cristais e oferece critérios de avaliação e orientação essenciais para o seu desenvolvimento futuro em direção ao projeto e descoberta de materiais fisicamente viáveis. Todas as estruturas cristalinas geradas pelos modelos, os resultados dos cálculos de fónons e os fluxos de trabalho de avaliação de alto rendimento desenvolvidos no PhononBench serão disponibilizados publicamente em https://github.com/xqh19970407/PhononBench.
English
In this work, we introduce PhononBench, the first large-scale benchmark for dynamical stability in AI-generated crystals. Leveraging the recently developed MatterSim interatomic potential, which achieves DFT-level accuracy in phonon predictions across more than 10,000 materials, PhononBench enables efficient large-scale phonon calculations and dynamical-stability analysis for 108,843 crystal structures generated by six leading crystal generation models. PhononBench reveals a widespread limitation of current generative models in ensuring dynamical stability: the average dynamical-stability rate across all generated structures is only 25.83%, with the top-performing model, MatterGen, reaching just 41.0%. Further case studies show that in property-targeted generation-illustrated here by band-gap conditioning with MatterGen--the dynamical-stability rate remains as low as 23.5% even at the optimal band-gap condition of 0.5 eV. In space-group-controlled generation, higher-symmetry crystals exhibit better stability (e.g., cubic systems achieve rates up to 49.2%), yet the average stability across all controlled generations is still only 34.4%. An important additional outcome of this study is the identification of 28,119 crystal structures that are phonon-stable across the entire Brillouin zone, providing a substantial pool of reliable candidates for future materials exploration. By establishing the first large-scale dynamical-stability benchmark, this work systematically highlights the current limitations of crystal generation models and offers essential evaluation criteria and guidance for their future development toward the design and discovery of physically viable materials. All model-generated crystal structures, phonon calculation results, and the high-throughput evaluation workflows developed in PhononBench will be openly released at https://github.com/xqh19970407/PhononBench