PhononBench: un benchmark su larga scala basato sui fononi per la stabilità dinamica nella generazione di cristalli
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation
December 24, 2025
Autori: Xiao-Qi Han, Ze-Feng Gao, Peng-Jie Guo, Zhong-Yi Lu
cs.AI
Abstract
In questo lavoro presentiamo PhononBench, il primo benchmark su larga scala per la stabilità dinamica nei cristalli generati dall'intelligenza artificiale. Sfruttando il potenziale interatomico MatterSim, recentemente sviluppato, che raggiunge un'accuratezza a livello DFT nelle previsioni dei fononi per oltre 10.000 materiali, PhononBench consente calcoli fononici su larga scala e analisi di stabilità dinamica efficienti per 108.843 strutture cristalline generate da sei modelli leader nella generazione di cristalli. PhononBench rivela una limitazione diffusa dei modelli generativi attuali nel garantire la stabilità dinamica: la percentuale media di stabilità dinamica attraverso tutte le strutture generate è solo del 25,83%, con il modello migliore, MatterGen, che raggiunge appena il 41,0%. Ulteriori casi di studio mostrano che nella generazione mirata alle proprietà - illustrata qui dal condizionamento del band gap con MatterGen - la percentuale di stabilità dinamica rimane bassa quanto il 23,5% anche nella condizione ottimale di band gap di 0,5 eV. Nella generazione controllata per gruppo spaziale, i cristalli con simmetria più alta mostrano una stabilità migliore (ad esempio, i sistemi cubici raggiungono percentuali fino al 49,2%), tuttavia la stabilità media attraverso tutte le generazioni controllate è ancora solo del 34,4%. Un risultato aggiuntivo importante di questo studio è l'identificazione di 28.119 strutture cristalline che sono fononicamente stabili in tutta la zona di Brillouin, fornendo un ampio bacino di candidati affidabili per la futura esplorazione di materiali. Stabilendo il primo benchmark su larga scala per la stabilità dinamica, questo lavoro evidenzia sistematicamente le attuali limitazioni dei modelli di generazione di cristalli e offre criteri di valutazione essenziali e linee guida per il loro sviluppo futuro verso la progettazione e la scoperta di materiali fisicamente realizzabili. Tutte le strutture cristalline generate dai modelli, i risultati dei calcoli fononici e i flussi di lavoro di valutazione ad alta produttività sviluppati in PhononBench saranno rilasciati apertamente all'indirizzo https://github.com/xqh19970407/PhononBench.
English
In this work, we introduce PhononBench, the first large-scale benchmark for dynamical stability in AI-generated crystals. Leveraging the recently developed MatterSim interatomic potential, which achieves DFT-level accuracy in phonon predictions across more than 10,000 materials, PhononBench enables efficient large-scale phonon calculations and dynamical-stability analysis for 108,843 crystal structures generated by six leading crystal generation models. PhononBench reveals a widespread limitation of current generative models in ensuring dynamical stability: the average dynamical-stability rate across all generated structures is only 25.83%, with the top-performing model, MatterGen, reaching just 41.0%. Further case studies show that in property-targeted generation-illustrated here by band-gap conditioning with MatterGen--the dynamical-stability rate remains as low as 23.5% even at the optimal band-gap condition of 0.5 eV. In space-group-controlled generation, higher-symmetry crystals exhibit better stability (e.g., cubic systems achieve rates up to 49.2%), yet the average stability across all controlled generations is still only 34.4%. An important additional outcome of this study is the identification of 28,119 crystal structures that are phonon-stable across the entire Brillouin zone, providing a substantial pool of reliable candidates for future materials exploration. By establishing the first large-scale dynamical-stability benchmark, this work systematically highlights the current limitations of crystal generation models and offers essential evaluation criteria and guidance for their future development toward the design and discovery of physically viable materials. All model-generated crystal structures, phonon calculation results, and the high-throughput evaluation workflows developed in PhononBench will be openly released at https://github.com/xqh19970407/PhononBench