PhononBench:結晶生成における動的安定性の評価のための大規模フォノンベースベンチマーク
PhononBench:A Large-Scale Phonon-Based Benchmark for Dynamical Stability in Crystal Generation
December 24, 2025
著者: Xiao-Qi Han, Ze-Feng Gao, Peng-Jie Guo, Zhong-Yi Lu
cs.AI
要旨
本研究では、AI生成結晶の動的安定性に関する初の大規模ベンチマーク「PhononBench」を提案する。最近開発されたMatterSim原子間ポテンシャルは1万種以上の材料においてフォノン予測でDFTレベルの精度を達成しており、これを活用することで、6つの主要結晶生成モデルによって生成された108,843の結晶構造に対して、効率的な大規模フォノン計算と動的安定性解析を可能にした。PhononBenchにより、現在の生成モデルが動的安定性を確保する際に広範に存在する限界が明らかとなった:全生成構造における平均動的安定率はわずか25.83%であり、最高性能のモデルであるMatterGenでも41.0%に留まった。さらに詳細なケーススタディでは、物性ターゲット生成(ここではMatterGenを用いたバンドギャップ条件付け)において、最適なバンドギャップ条件である0.5 eV時でも動的安定率は23.5%と低い値を示した。空間群制御生成では、高対称性結晶ほど優れた安定性を示す(例えば立方晶系は49.2%に達する)ものの、全ての制御生成における平均安定性は依然として34.4%に過ぎない。本研究の重要な副次的成果として、ブリルアンゾーン全域でフォノン安定性を有する28,119の結晶構造が同定され、将来の材料探索に向けた信頼性の高い候補群が大幅に拡充された。初の大規模動的安定性ベンチマークを確立することで、本研究は結晶生成モデルの現状の限界を体系的に浮き彫りにするとともに、物理的に実現可能な材料の設計・発見に向けた今後の発展に不可欠な評価基準と指針を提供する。PhononBenchで開発された全てのモデル生成結晶構造、フォノン計算結果、および高速評価ワークフローはhttps://github.com/xqh19970407/PhononBench で公開予定である。
English
In this work, we introduce PhononBench, the first large-scale benchmark for dynamical stability in AI-generated crystals. Leveraging the recently developed MatterSim interatomic potential, which achieves DFT-level accuracy in phonon predictions across more than 10,000 materials, PhononBench enables efficient large-scale phonon calculations and dynamical-stability analysis for 108,843 crystal structures generated by six leading crystal generation models. PhononBench reveals a widespread limitation of current generative models in ensuring dynamical stability: the average dynamical-stability rate across all generated structures is only 25.83%, with the top-performing model, MatterGen, reaching just 41.0%. Further case studies show that in property-targeted generation-illustrated here by band-gap conditioning with MatterGen--the dynamical-stability rate remains as low as 23.5% even at the optimal band-gap condition of 0.5 eV. In space-group-controlled generation, higher-symmetry crystals exhibit better stability (e.g., cubic systems achieve rates up to 49.2%), yet the average stability across all controlled generations is still only 34.4%. An important additional outcome of this study is the identification of 28,119 crystal structures that are phonon-stable across the entire Brillouin zone, providing a substantial pool of reliable candidates for future materials exploration. By establishing the first large-scale dynamical-stability benchmark, this work systematically highlights the current limitations of crystal generation models and offers essential evaluation criteria and guidance for their future development toward the design and discovery of physically viable materials. All model-generated crystal structures, phonon calculation results, and the high-throughput evaluation workflows developed in PhononBench will be openly released at https://github.com/xqh19970407/PhononBench