К агентному интеллекту для материаловедения
Towards Agentic Intelligence for Materials Science
January 29, 2026
Авторы: Huan Zhang, Yizhan Li, Wenhao Huang, Ziyu Hou, Yu Song, Xuye Liu, Farshid Effaty, Jinya Jiang, Sifan Wu, Qianggang Ding, Izumi Takahara, Leonard R. MacGillivray, Teruyasu Mizoguchi, Tianshu Yu, Lizi Liao, Yuyu Luo, Yu Rong, Jia Li, Ying Diao, Heng Ji, Bang Liu
cs.AI
Аннотация
Сближение искусственного интеллекта и материаловедения открывает трансформационные возможности, однако для достижения реального ускорения открытий необходимо выйти за рамки узкоспециализированных дообученных моделей и перейти к агентским системам, которые планируют, действуют и обучаются в рамках полного цикла открытия. В данном обзоре предлагается уникальный pipeline-ориентированный подход, охватывающий все этапы — от курации корпусов и предварительного обучения через адаптацию к предметной области и инструктивное тонкое настройку до целеориентированных агентов, взаимодействующих с платформами моделирования и эксперимента. В отличие от предыдущих обзоров, мы рассматриваем весь процесс как сквозную систему, оптимизируемую для достижения конкретных результатов открытий, а не для выполнения суррогатных бенчмарков. Такой подход позволяет проследить, как проектные решения на верхнем уровне — такие как курация данных и цели обучения — могут быть согласованы с успехом в последующих экспериментах через эффективное распределение заслуг.
Для объединения научных сообществ и создания общей системы координат мы сначала представляем интегрированную оптику, которая согласует терминологию, оценку и этапы рабочих процессов в области ИИ и материаловедения. Затем мы анализируем область через две целевые линзы: с точки зрения ИИ в обзоре детализируются сильные стороны больших языковых моделей в распознавании образов, прогнозной аналитике и обработке естественного языка для анализа литературы, характеризации материалов и предсказания свойств; с точки зрения материаловедения выделяются приложения в дизайне материалов, оптимизации процессов и ускорении вычислительных workflow за счет интеграции с внешними инструментами (например, DFT, роботизированные лаборатории). Наконец, мы противопоставляем пассивные, реактивные подходы агентскому дизайну, каталогизируя текущие достижения и аргументируя необходимость создания систем, преследующих долгосрочные цели с автономией, памятью и использованием инструментов. Данный обзор намечает практический путь к созданию автономных LLM-агентов, ориентированных на безопасность и нацеленных на открытие новых полезных материалов.
English
The convergence of artificial intelligence and materials science presents a transformative opportunity, but achieving true acceleration in discovery requires moving beyond task-isolated, fine-tuned models toward agentic systems that plan, act, and learn across the full discovery loop. This survey advances a unique pipeline-centric view that spans from corpus curation and pretraining, through domain adaptation and instruction tuning, to goal-conditioned agents interfacing with simulation and experimental platforms. Unlike prior reviews, we treat the entire process as an end-to-end system to be optimized for tangible discovery outcomes rather than proxy benchmarks. This perspective allows us to trace how upstream design choices-such as data curation and training objectives-can be aligned with downstream experimental success through effective credit assignment.
To bridge communities and establish a shared frame of reference, we first present an integrated lens that aligns terminology, evaluation, and workflow stages across AI and materials science. We then analyze the field through two focused lenses: From the AI perspective, the survey details LLM strengths in pattern recognition, predictive analytics, and natural language processing for literature mining, materials characterization, and property prediction; from the materials science perspective, it highlights applications in materials design, process optimization, and the acceleration of computational workflows via integration with external tools (e.g., DFT, robotic labs). Finally, we contrast passive, reactive approaches with agentic design, cataloging current contributions while motivating systems that pursue long-horizon goals with autonomy, memory, and tool use. This survey charts a practical roadmap towards autonomous, safety-aware LLM agents aimed at discovering novel and useful materials.