ChatPaper.aiChatPaper

Набор данных и модели неорганических материалов Open Materials 2024 (OMat24)

Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models

October 16, 2024
Авторы: Luis Barroso-Luque, Muhammed Shuaibi, Xiang Fu, Brandon M. Wood, Misko Dzamba, Meng Gao, Ammar Rizvi, C. Lawrence Zitnick, Zachary W. Ulissi
cs.AI

Аннотация

Способность открывать новые материалы с желаемыми свойствами критически важна для многих областей, начиная от помощи в смягчении изменения климата до прогресса в аппаратных средствах вычислительной техники следующего поколения. Искусственный интеллект имеет потенциал ускорить открытие и разработку материалов путем более эффективного исследования химического пространства по сравнению с другими вычислительными методами или методом проб и ошибок. Хотя был достигнут значительный прогресс в области использования искусственного интеллекта для данных, бенчмарков и моделей материалов, возникла проблема в виде отсутствия общедоступных обучающих данных и открытых предварительно обученных моделей. Для решения этой проблемы мы представляем мета-релиз Meta FAIR набора данных Open Materials 2024 (OMat24) крупного масштаба и сопутствующий набор предварительно обученных моделей. OMat24 содержит более 110 миллионов расчетов методом плотностного функционала (DFT), сосредоточенных на структурном и композиционном разнообразии. Наши модели EquiformerV2 достигают передовых результатов на доске лидеров Matbench Discovery и способны предсказывать устойчивость основного состояния и энергии образования с F1-оценкой выше 0,9 и точностью 20 мэВ/атом соответственно. Мы исследуем влияние размера модели, вспомогательных целей денойзинга и донастройки на результативность на различных наборах данных, включая OMat24, MPtraj и Alexandria. Открытый релиз набора данных OMat24 и моделей позволяет научному сообществу продолжить нашу работу и продвигать дальнейшие достижения в области искусственного интеллекта в материаловедении.
English
The ability to discover new materials with desirable properties is critical for numerous applications from helping mitigate climate change to advances in next generation computing hardware. AI has the potential to accelerate materials discovery and design by more effectively exploring the chemical space compared to other computational methods or by trial-and-error. While substantial progress has been made on AI for materials data, benchmarks, and models, a barrier that has emerged is the lack of publicly available training data and open pre-trained models. To address this, we present a Meta FAIR release of the Open Materials 2024 (OMat24) large-scale open dataset and an accompanying set of pre-trained models. OMat24 contains over 110 million density functional theory (DFT) calculations focused on structural and compositional diversity. Our EquiformerV2 models achieve state-of-the-art performance on the Matbench Discovery leaderboard and are capable of predicting ground-state stability and formation energies to an F1 score above 0.9 and an accuracy of 20 meV/atom, respectively. We explore the impact of model size, auxiliary denoising objectives, and fine-tuning on performance across a range of datasets including OMat24, MPtraj, and Alexandria. The open release of the OMat24 dataset and models enables the research community to build upon our efforts and drive further advancements in AI-assisted materials science.

Summary

AI-Generated Summary

PDF71November 16, 2024