ChatPaper.aiChatPaper

Rumo à Descoberta de Materiais Totalmente Automatizada por meio de Conjuntos de Dados de Síntese em Grande Escala e LLM de Nível Especialista como Juiz.

Towards Fully-Automated Materials Discovery via Large-Scale Synthesis Dataset and Expert-Level LLM-as-a-Judge

February 23, 2025
Autores: Heegyu Kim, Taeyang Jeon, Seungtaek Choi, Jihoon Hong, Dongwon Jeon, Sungbum Cho, Ga-Yeon Baek, Kyung-Won Kwak, Dong-Hee Lee, Sun-Jin Choi, Jisu Bae, Chihoon Lee, Yunseo Kim, Jinsung Park, Hyunsouk Cho
cs.AI

Resumo

A síntese de materiais é vital para inovações como armazenamento de energia, catálise, eletrônicos e dispositivos biomédicos. No entanto, o processo depende fortemente de métodos empíricos de tentativa e erro guiados pela intuição de especialistas. Nosso trabalho tem como objetivo apoiar a comunidade de ciência dos materiais, fornecendo um recurso prático e baseado em dados. Curamos um conjunto abrangente de dados de 17 mil receitas de síntese verificadas por especialistas na literatura de acesso aberto, que é a base de nosso novo benchmark, AlchemyBench. AlchemyBench oferece um framework de ponta a ponta que apoia a pesquisa em grandes modelos de linguagem aplicados à previsão de síntese. Ele abrange tarefas-chave, incluindo previsão de materiais brutos e equipamentos, geração de procedimentos de síntese e previsão de resultados de caracterização. Propomos um framework LLM-como-Juiz que aproveita grandes modelos de linguagem para avaliação automatizada, demonstrando forte concordância estatística com avaliações de especialistas. No geral, nossas contribuições oferecem uma base de apoio para explorar as capacidades de LLMs na previsão e orientação da síntese de materiais, abrindo caminho para um design experimental mais eficiente e inovação acelerada na ciência dos materiais.
English
Materials synthesis is vital for innovations such as energy storage, catalysis, electronics, and biomedical devices. Yet, the process relies heavily on empirical, trial-and-error methods guided by expert intuition. Our work aims to support the materials science community by providing a practical, data-driven resource. We have curated a comprehensive dataset of 17K expert-verified synthesis recipes from open-access literature, which forms the basis of our newly developed benchmark, AlchemyBench. AlchemyBench offers an end-to-end framework that supports research in large language models applied to synthesis prediction. It encompasses key tasks, including raw materials and equipment prediction, synthesis procedure generation, and characterization outcome forecasting. We propose an LLM-as-a-Judge framework that leverages large language models for automated evaluation, demonstrating strong statistical agreement with expert assessments. Overall, our contributions offer a supportive foundation for exploring the capabilities of LLMs in predicting and guiding materials synthesis, ultimately paving the way for more efficient experimental design and accelerated innovation in materials science.

Summary

AI-Generated Summary

PDF112February 25, 2025