ChemDFM-R: Um Raciocinador Químico de Modelo de Linguagem Aprimorado com Conhecimento Químico Atomizado
ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge
July 29, 2025
Autores: Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, Da Ma, Zichen Zhu, Danyang Zhang, Huayang Wang, Zhongyang Dai, Liyang Wen, Xin Chen, Kai Yu
cs.AI
Resumo
Embora os grandes modelos de linguagem (LLMs) tenham alcançado progressos impressionantes, sua aplicação em domínios científicos, como a química, ainda é limitada por uma compreensão superficial do domínio e capacidades de raciocínio restritas. Neste trabalho, focamos no campo específico da química e desenvolvemos um modelo de linguagem especializado em raciocínio químico, o ChemDFM-R. Primeiro, construímos um conjunto de dados abrangente de pontos de conhecimento atomizados para aprimorar a compreensão do modelo sobre os princípios fundamentais e a estrutura lógica da química. Em seguida, propomos uma estratégia de destilação de fontes mistas que integra conhecimento curado por especialistas com habilidades de raciocínio de domínio geral, seguida por um reforço de aprendizado específico do domínio para aprimorar o raciocínio químico. Experimentos em diversos benchmarks químicos demonstram que o ChemDFM-R alcança desempenho de ponta, fornecendo saídas interpretáveis e baseadas em racionalizações. Estudos de caso adicionais ilustram como cadeias de raciocínio explícitas melhoram significativamente a confiabilidade, transparência e utilidade prática do modelo em cenários reais de colaboração humano-IA.
English
While large language models (LLMs) have achieved impressive progress, their
application in scientific domains such as chemistry remains hindered by shallow
domain understanding and limited reasoning capabilities. In this work, we focus
on the specific field of chemistry and develop a Chemical Reasoner LLM,
ChemDFM-R. We first construct a comprehensive dataset of atomized knowledge
points to enhance the model's understanding of the fundamental principles and
logical structure of chemistry. Then, we propose a mix-sourced distillation
strategy that integrates expert-curated knowledge with general-domain reasoning
skills, followed by domain-specific reinforcement learning to enhance chemical
reasoning. Experiments on diverse chemical benchmarks demonstrate that
ChemDFM-R achieves state-of-the-art performance while providing interpretable,
rationale-driven outputs. Further case studies illustrate how explicit
reasoning chains significantly improve the reliability, transparency, and
practical utility of the model in real-world human-AI collaboration scenarios.