PhononBench: Ein umfangreicher phononenbasierter Benchmark für die dynamische Stabilität in der Kristallgenerierung
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation
December 24, 2025
papers.authors: Xiao-Qi Han, Ze-Feng Gao, Peng-Jie Guo, Zhong-Yi Lu
cs.AI
papers.abstract
In dieser Arbeit stellen wir PhononBench vor, den ersten umfassenden Benchmark für dynamische Stabilität in KI-generierten Kristallen. Unter Nutzung des kürzlich entwickelten MatterSim-Interatomaren Potentials, das DFT-genaue Phononenvorhersagen für über 10.000 Materialien erreicht, ermöglicht PhononBench effiziente großangelegte Phononenberechnungen und Dynamische-Stabilitäts-Analysen für 108.843 Kristallstrukturen, die von sechs führenden Kristallgenerierungsmodellen erzeugt wurden. PhononBench deckt eine weitverbreitete Einschränkung aktueller generativer Modelle bei der Gewährleistung dynamischer Stabilität auf: Die durchschnittliche Rate dynamischer Stabilität über alle generierten Strukturen beträgt nur 25,83 %, wobei das leistungsstärkste Modell, MatterGen, lediglich 41,0 % erreicht. Weitere Fallstudien zeigen, dass bei eigenschaftsorientierter Generierung – hier veranschaulicht durch Bandlücken-Konditionierung mit MatterGen – die Rate dynamischer Stabilität selbst unter der optimalen Bandlücken-Bedingung von 0,5 eV mit nur 23,5 % niedrig bleibt. Bei raumgruppengesteuerter Generierung weisen Kristalle mit höherer Symmetrie eine bessere Stabilität auf (z.B. erreichen kubische Systeme Raten von bis zu 49,2 %), dennoch beträgt die durchschnittliche Stabilität über alle gesteuerten Generierungen immer noch nur 34,4 %. Ein wichtiges zusätzliches Ergebnis dieser Studie ist die Identifizierung von 28.119 Kristallstrukturen, die über die gesamte Brillouin-Zone phononenstabil sind, was einen beträchtlichen Pool zuverlässiger Kandidaten für die zukünftige Materialforschung bereitstellt. Durch die Etablierung des ersten großangelegten Benchmarks für dynamische Stabilität unterstreicht diese Arbeit systematisch die aktuellen Grenzen von Kristallgenerierungsmodellen und bietet essentielle Bewertungskriterien und Leitlinien für ihre zukünftige Entwicklung hin zum Entwurf und zur Entdeckung physikalisch realisierbarer Materialien. Alle modellgenerierten Kristallstrukturen, Phononenberechnungsergebnisse und die in PhononBench entwickelten Hochdurchsatz-Auswertungsworkflows werden unter https://github.com/xqh19970407/PhononBench offen zugänglich gemacht.
English
In this work, we introduce PhononBench, the first large-scale benchmark for dynamical stability in AI-generated crystals. Leveraging the recently developed MatterSim interatomic potential, which achieves DFT-level accuracy in phonon predictions across more than 10,000 materials, PhononBench enables efficient large-scale phonon calculations and dynamical-stability analysis for 108,843 crystal structures generated by six leading crystal generation models. PhononBench reveals a widespread limitation of current generative models in ensuring dynamical stability: the average dynamical-stability rate across all generated structures is only 25.83%, with the top-performing model, MatterGen, reaching just 41.0%. Further case studies show that in property-targeted generation-illustrated here by band-gap conditioning with MatterGen--the dynamical-stability rate remains as low as 23.5% even at the optimal band-gap condition of 0.5 eV. In space-group-controlled generation, higher-symmetry crystals exhibit better stability (e.g., cubic systems achieve rates up to 49.2%), yet the average stability across all controlled generations is still only 34.4%. An important additional outcome of this study is the identification of 28,119 crystal structures that are phonon-stable across the entire Brillouin zone, providing a substantial pool of reliable candidates for future materials exploration. By establishing the first large-scale dynamical-stability benchmark, this work systematically highlights the current limitations of crystal generation models and offers essential evaluation criteria and guidance for their future development toward the design and discovery of physically viable materials. All model-generated crystal structures, phonon calculation results, and the high-throughput evaluation workflows developed in PhononBench will be openly released at https://github.com/xqh19970407/PhononBench