ChemDFM-R: Un modelo de lenguaje para razonamiento químico potenciado con conocimiento químico atomizado
ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge
July 29, 2025
Autores: Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, Da Ma, Zichen Zhu, Danyang Zhang, Huayang Wang, Zhongyang Dai, Liyang Wen, Xin Chen, Kai Yu
cs.AI
Resumen
Si bien los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han logrado avances impresionantes, su aplicación en dominios científicos como la química sigue estando limitada por una comprensión superficial del dominio y capacidades de razonamiento limitadas. En este trabajo, nos enfocamos en el campo específico de la química y desarrollamos un modelo de lenguaje de gran escala para el razonamiento químico, ChemDFM-R. Primero, construimos un conjunto de datos exhaustivo de puntos de conocimiento atomizados para mejorar la comprensión del modelo sobre los principios fundamentales y la estructura lógica de la química. Luego, proponemos una estrategia de destilación de fuentes mixtas que integra conocimiento curado por expertos con habilidades de razonamiento de dominio general, seguida de un aprendizaje por refuerzo específico del dominio para mejorar el razonamiento químico. Los experimentos en diversos benchmarks químicos demuestran que ChemDFM-R alcanza un rendimiento de vanguardia mientras proporciona resultados interpretables y basados en razonamientos. Estudios de caso adicionales ilustran cómo las cadenas de razonamiento explícitas mejoran significativamente la confiabilidad, transparencia y utilidad práctica del modelo en escenarios reales de colaboración humano-IA.
English
While large language models (LLMs) have achieved impressive progress, their
application in scientific domains such as chemistry remains hindered by shallow
domain understanding and limited reasoning capabilities. In this work, we focus
on the specific field of chemistry and develop a Chemical Reasoner LLM,
ChemDFM-R. We first construct a comprehensive dataset of atomized knowledge
points to enhance the model's understanding of the fundamental principles and
logical structure of chemistry. Then, we propose a mix-sourced distillation
strategy that integrates expert-curated knowledge with general-domain reasoning
skills, followed by domain-specific reinforcement learning to enhance chemical
reasoning. Experiments on diverse chemical benchmarks demonstrate that
ChemDFM-R achieves state-of-the-art performance while providing interpretable,
rationale-driven outputs. Further case studies illustrate how explicit
reasoning chains significantly improve the reliability, transparency, and
practical utility of the model in real-world human-AI collaboration scenarios.