ChatPaper.aiChatPaper

Conjunto de Datos y Modelos de Materiales Inorgánicos Open Materials 2024 (OMat24)

Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models

October 16, 2024
Autores: Luis Barroso-Luque, Muhammed Shuaibi, Xiang Fu, Brandon M. Wood, Misko Dzamba, Meng Gao, Ammar Rizvi, C. Lawrence Zitnick, Zachary W. Ulissi
cs.AI

Resumen

La capacidad de descubrir nuevos materiales con propiedades deseables es fundamental para numerosas aplicaciones, desde ayudar a mitigar el cambio climático hasta avances en hardware de computación de próxima generación. La inteligencia artificial tiene el potencial de acelerar el descubrimiento y diseño de materiales al explorar de manera más efectiva el espacio químico en comparación con otros métodos computacionales o por ensayo y error. Aunque se ha logrado un progreso significativo en IA para datos, puntos de referencia y modelos de materiales, una barrera que ha surgido es la falta de datos de entrenamiento públicamente disponibles y modelos pre-entrenados abiertos. Para abordar esto, presentamos una versión Meta FAIR del conjunto de datos abierto a gran escala Open Materials 2024 (OMat24) y un conjunto de modelos pre-entrenados correspondientes. OMat24 contiene más de 110 millones de cálculos de teoría funcional de la densidad (DFT) centrados en la diversidad estructural y composicional. Nuestros modelos EquiformerV2 logran un rendimiento de vanguardia en el Matbench Discovery leaderboard y son capaces de predecir la estabilidad del estado fundamental y las energías de formación a una puntuación F1 superior a 0.9 y una precisión de 20 meV/átomo, respectivamente. Exploramos el impacto del tamaño del modelo, objetivos auxiliares de eliminación de ruido y ajuste fino en el rendimiento en una variedad de conjuntos de datos, incluidos OMat24, MPtraj y Alexandria. La liberación abierta del conjunto de datos y modelos OMat24 permite a la comunidad investigadora construir sobre nuestros esfuerzos y promover nuevos avances en la ciencia de materiales asistida por IA.
English
The ability to discover new materials with desirable properties is critical for numerous applications from helping mitigate climate change to advances in next generation computing hardware. AI has the potential to accelerate materials discovery and design by more effectively exploring the chemical space compared to other computational methods or by trial-and-error. While substantial progress has been made on AI for materials data, benchmarks, and models, a barrier that has emerged is the lack of publicly available training data and open pre-trained models. To address this, we present a Meta FAIR release of the Open Materials 2024 (OMat24) large-scale open dataset and an accompanying set of pre-trained models. OMat24 contains over 110 million density functional theory (DFT) calculations focused on structural and compositional diversity. Our EquiformerV2 models achieve state-of-the-art performance on the Matbench Discovery leaderboard and are capable of predicting ground-state stability and formation energies to an F1 score above 0.9 and an accuracy of 20 meV/atom, respectively. We explore the impact of model size, auxiliary denoising objectives, and fine-tuning on performance across a range of datasets including OMat24, MPtraj, and Alexandria. The open release of the OMat24 dataset and models enables the research community to build upon our efforts and drive further advancements in AI-assisted materials science.

Summary

AI-Generated Summary

PDF71November 16, 2024