ChatPaper.aiChatPaper

Offene Materialien 2024 (OMat24) Datensatz und Modelle für anorganische Materialien

Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models

October 16, 2024
Autoren: Luis Barroso-Luque, Muhammed Shuaibi, Xiang Fu, Brandon M. Wood, Misko Dzamba, Meng Gao, Ammar Rizvi, C. Lawrence Zitnick, Zachary W. Ulissi
cs.AI

Zusammenfassung

Die Fähigkeit, neue Materialien mit wünschenswerten Eigenschaften zu entdecken, ist für zahlreiche Anwendungen von entscheidender Bedeutung, von der Unterstützung bei der Minderung des Klimawandels bis hin zu Fortschritten in der Hardware für die nächste Generation von Computern. KI hat das Potenzial, die Entdeckung und Gestaltung von Materialien zu beschleunigen, indem sie den chemischen Raum effektiver erkundet im Vergleich zu anderen rechnergestützten Methoden oder durch Ausprobieren. Obwohl bereits erhebliche Fortschritte bei KI für Materialdaten, Benchmarks und Modelle erzielt wurden, ist eine Hürde, die aufgetreten ist, der Mangel an öffentlich verfügbaren Trainingsdaten und offenen vortrainierten Modellen. Um dies zu lösen, präsentieren wir eine Meta FAIR-Veröffentlichung des Open Materials 2024 (OMat24) groß angelegten offenen Datensatzes und einer begleitenden Reihe von vortrainierten Modellen. OMat24 enthält über 110 Millionen Dichtefunktionaltheorie (DFT)-Berechnungen, die auf strukturelle und kompositionelle Vielfalt ausgerichtet sind. Unsere EquiformerV2-Modelle erzielen Spitzenleistungen auf der Matbench Discovery-Rangliste und sind in der Lage, den Grundzustandstabilität und Bildungsenergien mit einem F1-Score über 0,9 bzw. einer Genauigkeit von 20 meV/Atom vorherzusagen. Wir untersuchen die Auswirkungen von Modellgröße, zusätzlichen Rauschunterdrückungszielen und Feinabstimmung auf die Leistung über eine Reihe von Datensätzen, einschließlich OMat24, MPtraj und Alexandria. Die offene Veröffentlichung des OMat24-Datensatzes und der Modelle ermöglicht es der Forschungsgemeinschaft, auf unseren Bemühungen aufzubauen und weitere Fortschritte in der KI-unterstützten Materialwissenschaft voranzutreiben.
English
The ability to discover new materials with desirable properties is critical for numerous applications from helping mitigate climate change to advances in next generation computing hardware. AI has the potential to accelerate materials discovery and design by more effectively exploring the chemical space compared to other computational methods or by trial-and-error. While substantial progress has been made on AI for materials data, benchmarks, and models, a barrier that has emerged is the lack of publicly available training data and open pre-trained models. To address this, we present a Meta FAIR release of the Open Materials 2024 (OMat24) large-scale open dataset and an accompanying set of pre-trained models. OMat24 contains over 110 million density functional theory (DFT) calculations focused on structural and compositional diversity. Our EquiformerV2 models achieve state-of-the-art performance on the Matbench Discovery leaderboard and are capable of predicting ground-state stability and formation energies to an F1 score above 0.9 and an accuracy of 20 meV/atom, respectively. We explore the impact of model size, auxiliary denoising objectives, and fine-tuning on performance across a range of datasets including OMat24, MPtraj, and Alexandria. The open release of the OMat24 dataset and models enables the research community to build upon our efforts and drive further advancements in AI-assisted materials science.

Summary

AI-Generated Summary

PDF71November 16, 2024