MDAgent2: Groot Taalmodel voor Codegeneratie en Kennis-V&A in Moleculaire Dynamica

Samenvatting

Molecular dynamics (MD)-simulaties zijn essentieel voor het begrijpen van gedrag op atomaire schaal in de materiaalkunde, maar het schrijven van LAMMPS-scripts blijft zeer gespecialiseerd en tijdrovend. Hoewel grote taalmodel(len) (LLM's) veelbelovend zijn op het gebied van codegeneratie en vraagbeantwoording in specifieke domeinen, wordt hun prestaties in MD-scenario's beperkt door schaarse domeingegevens, de hoge implementatiekosten van state-of-the-art LLM's en een lage code-uitvoerbaarheid. Voortbouwend op ons eerdere MDAgent, presenteren wij MDAgent2, het eerste end-to-end raamwerk dat zowel kennis-vraag-en-antwoord als codegeneratie binnen het MD-domein kan uitvoeren. Wij hebben een domeinspecifieke pijplijn voor dataconstructie ontwikkeld die drie hoogwaardige datasets oplevert, die zich uitstrekken over MD-kennis, vraagbeantwoording en codegeneratie. Op basis van deze datasets hanteren wij een drietraps na-trainingsstrategie – voortgezet vooraf trainen (CPT), supervised fine-tuning (SFT) en reinforcement learning (RL) – om twee domeinaangepaste modellen te trainen: MD-Instruct en MD-Code. Verder introduceren wij MD-GRPO, een gesloten-lus RL-methode die simulatieresultaten gebruikt als beloningssignalen en trajecten met lage beloning recycleert voor continue verfijning. Wij bouwden verder MDAgent2-RUNTIME, een inzetbaar multi-agent systeem dat codegeneratie, uitvoering, evaluatie en zelfcorrectie integreert. Samen met MD-EvalBench, voorgesteld in dit werk, de eerste benchmark voor LAMMPS-codegeneratie en vraagbeantwoording, behalen onze modellen en systeem prestaties die verschillende sterke baseline-modellen overtreffen. Dit werk toont systematisch de aanpasbaarheid en generalisatiecapaciteit van grote taalmodel(len) in industriële simulatietaken aan, en legt een methodologische basis voor automatische codegeneratie in AI voor Science en industriële schaalsimulaties. URL: https://github.com/FredericVAN/PKU_MDAgent2

English

Molecular dynamics (MD) simulations are essential for understanding atomic-scale behaviors in materials science, yet writing LAMMPS scripts remains highly specialized and time-consuming tasks. Although LLMs show promise in code generation and domain-specific question answering, their performance in MD scenarios is limited by scarce domain data, the high deployment cost of state-of-the-art LLMs, and low code executability. Building upon our prior MDAgent, we present MDAgent2, the first end-to-end framework capable of performing both knowledge Q&A and code generation within the MD domain. We construct a domain-specific data-construction pipeline that yields three high-quality datasets spanning MD knowledge, question answering, and code generation. Based on these datasets, we adopt a three stage post-training strategy--continued pre-training (CPT), supervised fine-tuning (SFT), and reinforcement learning (RL)--to train two domain-adapted models, MD-Instruct and MD-Code. Furthermore, we introduce MD-GRPO, a closed-loop RL method that leverages simulation outcomes as reward signals and recycles low-reward trajectories for continual refinement. We further build MDAgent2-RUNTIME, a deployable multi-agent system that integrates code generation, execution, evaluation, and self-correction. Together with MD-EvalBench proposed in this work, the first benchmark for LAMMPS code generation and question answering, our models and system achieve performance surpassing several strong baselines.This work systematically demonstrates the adaptability and generalization capability of large language models in industrial simulation tasks, laying a methodological foundation for automatic code generation in AI for Science and industrial-scale simulations. URL: https://github.com/FredericVAN/PKU_MDAgent2

MDAgent2: Groot Taalmodel voor Codegeneratie en Kennis-V&A in Moleculaire Dynamica

MDAgent2: Large Language Model for Code Generation and Knowledge Q&A in Molecular Dynamics

Samenvatting

Support