ChatPaper.aiChatPaper

AutoMat: Habilitando la Reconstrucción Automatizada de Estructuras Cristalinas a partir de Microscopía mediante el Uso de Herramientas Agénticas

AutoMat: Enabling Automated Crystal Structure Reconstruction from Microscopy via Agentic Tool Use

May 19, 2025
Autores: Yaotian Yang, Yiwen Tang, Yizhe Chen, Xiao Chen, Jiangjie Qiu, Hao Xiong, Haoyu Yin, Zhiyao Luo, Yifei Zhang, Sijia Tao, Wentao Li, Qinghua Zhang, Yuqiang Li, Wanli Ouyang, Bin Zhao, Xiaonan Wang, Fei Wei
cs.AI

Resumen

Los potenciales interatómicos y campos de fuerza basados en aprendizaje automático dependen críticamente de estructuras atómicas precisas, sin embargo, tales datos son escasos debido a la disponibilidad limitada de cristales resueltos experimentalmente. Aunque la microscopía electrónica de resolución atómica ofrece una fuente potencial de datos estructurales, la conversión de estas imágenes en formatos listos para simulación sigue siendo laboriosa y propensa a errores, creando un cuello de botella para el entrenamiento y validación de modelos. Presentamos AutoMat, una pipeline integral asistida por agentes que transforma automáticamente imágenes de microscopía electrónica de transmisión por barrido (STEM) en estructuras cristalinas atómicas y predice sus propiedades físicas. AutoMat combina eliminación de ruido adaptativa a patrones, recuperación de plantillas guiada por física, reconstrucción atómica consciente de la simetría, relajación rápida y predicción de propiedades mediante MatterSim, y orquestación coordinada en todas las etapas. Proponemos el primer STEM2Mat-Bench dedicado a esta tarea y evaluamos el rendimiento utilizando el error cuadrático medio de la red (RMSD), el error absoluto medio de la energía de formación (MAE) y la tasa de éxito en la coincidencia de estructuras. Al orquestar llamadas a herramientas externas, AutoMat permite que un modelo de lenguaje grande (LLM) basado únicamente en texto supere a los modelos de lenguaje-visión en este dominio, logrando un razonamiento de bucle cerrado a lo largo de la pipeline. En experimentos a gran escala con más de 450 muestras de estructuras, AutoMat supera sustancialmente a los modelos de lenguaje grandes multimodales y herramientas existentes. Estos resultados validan tanto a AutoMat como a STEM2Mat-Bench, marcando un paso clave hacia la conexión entre la microscopía y la simulación atomística en la ciencia de materiales. El código y el conjunto de datos están disponibles públicamente en https://github.com/yyt-2378/AutoMat y https://huggingface.co/datasets/yaotianvector/STEM2Mat.
English
Machine learning-based interatomic potentials and force fields depend critically on accurate atomic structures, yet such data are scarce due to the limited availability of experimentally resolved crystals. Although atomic-resolution electron microscopy offers a potential source of structural data, converting these images into simulation-ready formats remains labor-intensive and error-prone, creating a bottleneck for model training and validation. We introduce AutoMat, an end-to-end, agent-assisted pipeline that automatically transforms scanning transmission electron microscopy (STEM) images into atomic crystal structures and predicts their physical properties. AutoMat combines pattern-adaptive denoising, physics-guided template retrieval, symmetry-aware atomic reconstruction, fast relaxation and property prediction via MatterSim, and coordinated orchestration across all stages. We propose the first dedicated STEM2Mat-Bench for this task and evaluate performance using lattice RMSD, formation energy MAE, and structure-matching success rate. By orchestrating external tool calls, AutoMat enables a text-only LLM to outperform vision-language models in this domain, achieving closed-loop reasoning throughout the pipeline. In large-scale experiments over 450 structure samples, AutoMat substantially outperforms existing multimodal large language models and tools. These results validate both AutoMat and STEM2Mat-Bench, marking a key step toward bridging microscopy and atomistic simulation in materials science.The code and dataset are publicly available at https://github.com/yyt-2378/AutoMat and https://huggingface.co/datasets/yaotianvector/STEM2Mat.

Summary

AI-Generated Summary

PDF62May 22, 2025