ChemDFM-R: Een chemisch redeneer-LLM versterkt met geatomiseerde chemische kennis
ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge
July 29, 2025
Auteurs: Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, Da Ma, Zichen Zhu, Danyang Zhang, Huayang Wang, Zhongyang Dai, Liyang Wen, Xin Chen, Kai Yu
cs.AI
Samenvatting
Hoewel grote taalmodellen (LLMs) indrukwekkende vooruitgang hebben geboekt, wordt hun toepassing in wetenschappelijke domeinen zoals scheikunde nog steeds belemmerd door een oppervlakkig domeinbegrip en beperkte redeneervaardigheden. In dit werk richten we ons op het specifieke vakgebied van scheikunde en ontwikkelen we een Chemical Reasoner LLM, genaamd ChemDFM-R. We construeren eerst een uitgebreide dataset van geatomiseerde kennispunten om het begrip van het model van de fundamentele principes en logische structuur van scheikunde te verbeteren. Vervolgens stellen we een mix-sourced distillatiestrategie voor die door experts samengestelde kennis integreert met algemene redeneervaardigheden, gevolgd door domeinspecifieke reinforcement learning om het chemisch redeneren te versterken. Experimenten op diverse chemische benchmarks tonen aan dat ChemDFM-R state-of-the-art prestaties bereikt terwijl het interpreteerbare, op redenering gebaseerde uitvoer biedt. Verdere casestudies illustreren hoe expliciete redeneerketens de betrouwbaarheid, transparantie en praktische bruikbaarheid van het model aanzienlijk verbeteren in realistische scenario's van mens-AI-samenwerking.
English
While large language models (LLMs) have achieved impressive progress, their
application in scientific domains such as chemistry remains hindered by shallow
domain understanding and limited reasoning capabilities. In this work, we focus
on the specific field of chemistry and develop a Chemical Reasoner LLM,
ChemDFM-R. We first construct a comprehensive dataset of atomized knowledge
points to enhance the model's understanding of the fundamental principles and
logical structure of chemistry. Then, we propose a mix-sourced distillation
strategy that integrates expert-curated knowledge with general-domain reasoning
skills, followed by domain-specific reinforcement learning to enhance chemical
reasoning. Experiments on diverse chemical benchmarks demonstrate that
ChemDFM-R achieves state-of-the-art performance while providing interpretable,
rationale-driven outputs. Further case studies illustrate how explicit
reasoning chains significantly improve the reliability, transparency, and
practical utility of the model in real-world human-AI collaboration scenarios.