ChatPaper.aiChatPaper

Dataset e Modelli di Materiali Inorganici Open Materials 2024 (OMat24)

Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models

October 16, 2024
Autori: Luis Barroso-Luque, Muhammed Shuaibi, Xiang Fu, Brandon M. Wood, Misko Dzamba, Meng Gao, Ammar Rizvi, C. Lawrence Zitnick, Zachary W. Ulissi
cs.AI

Abstract

La capacità di scoprire nuovi materiali con proprietà desiderabili è fondamentale per numerose applicazioni, dal contribuire a mitigare il cambiamento climatico ai progressi nell'hardware informatico di prossima generazione. L'Intelligenza Artificiale ha il potenziale per accelerare la scoperta e il design dei materiali esplorando in modo più efficace lo spazio chimico rispetto ad altri metodi computazionali o al tentativo ed errore. Nonostante siano stati compiuti progressi significativi sull'uso dell'IA per i dati, i benchmark e i modelli dei materiali, è emerso un ostacolo rappresentato dalla mancanza di dati di addestramento pubblicamente disponibili e modelli pre-addestrati aperti. Per affrontare questo problema, presentiamo una versione Meta FAIR del dataset aperto su larga scala Open Materials 2024 (OMat24) e un insieme di modelli pre-addestrati correlati. OMat24 contiene oltre 110 milioni di calcoli di teoria funzionale della densità (DFT) focalizzati sulla diversità strutturale e compositiva. I nostri modelli EquiformerV2 raggiungono prestazioni all'avanguardia nella classifica Matbench Discovery e sono in grado di prevedere la stabilità dello stato fondamentale e le energie di formazione con un punteggio F1 superiore a 0,9 e un'accuratezza di 20 meV/atomo, rispettivamente. Esploriamo l'impatto delle dimensioni del modello, degli obiettivi ausiliari di denoising e del fine-tuning sulle prestazioni su una serie di dataset tra cui OMat24, MPtraj e Alexandria. Il rilascio aperto del dataset OMat24 e dei modelli consente alla comunità di ricerca di basarsi sui nostri sforzi e promuovere ulteriori progressi nella scienza dei materiali assistita dall'IA.
English
The ability to discover new materials with desirable properties is critical for numerous applications from helping mitigate climate change to advances in next generation computing hardware. AI has the potential to accelerate materials discovery and design by more effectively exploring the chemical space compared to other computational methods or by trial-and-error. While substantial progress has been made on AI for materials data, benchmarks, and models, a barrier that has emerged is the lack of publicly available training data and open pre-trained models. To address this, we present a Meta FAIR release of the Open Materials 2024 (OMat24) large-scale open dataset and an accompanying set of pre-trained models. OMat24 contains over 110 million density functional theory (DFT) calculations focused on structural and compositional diversity. Our EquiformerV2 models achieve state-of-the-art performance on the Matbench Discovery leaderboard and are capable of predicting ground-state stability and formation energies to an F1 score above 0.9 and an accuracy of 20 meV/atom, respectively. We explore the impact of model size, auxiliary denoising objectives, and fine-tuning on performance across a range of datasets including OMat24, MPtraj, and Alexandria. The open release of the OMat24 dataset and models enables the research community to build upon our efforts and drive further advancements in AI-assisted materials science.

Summary

AI-Generated Summary

PDF71November 16, 2024