Chem-R: 化学者として推論することを学ぶ
Chem-R: Learning to Reason as a Chemist
October 19, 2025
著者: Weida Wang, Benteng Chen, Di Zhang, Wanhao Liu, Shuchen Pu, Ben Gao, Jin Zeng, Lei Bai, Wanli Ouyang, Xiaoyong Wei, Tianshu Yu, Tianfan Fu, Shuzhou Sun, Jiatong Li, Zifu Wang, Yuqiang Li, Shufei Zhang
cs.AI
要旨
大規模言語モデル(LLM)は化学発見を進展させる大きな可能性を秘めているものの、現状のLLMは核心的な化学知識を欠き、信頼性の低い推論プロセスを生成し、多様な化学タスクにおいて最適な性能を発揮できていない。これらの課題に対処するため、我々はChem-Rを提案する。これは化学者の熟慮プロセスを模倣するように設計された、汎用性の高い化学推論モデルである。Chem-Rは、高度な推論能力を段階的に構築する3段階のフレームワークを通じて訓練される。具体的には、1)化学基礎訓練:核心的な化学知識を確立する、2)化学推論プロトコル蒸留:体系的な信頼性の高い問題解決を導くために、構造化された専門家のような推論トレースを組み込む、3)マルチタスクグループ相対ポリシー最適化:分子レベルおよび反応レベルの多様なタスクにおいてバランスの取れた性能を最適化する。この構造化されたパイプラインにより、Chem-Rは包括的なベンチマークにおいて最先端の性能を達成し、分子タスクでは最大46%、反応タスクでは最大66%の性能向上でGemini-2.5-ProやDeepSeek-R1などの主要な大規模言語モデルを凌駕した。同時に、Chem-Rは既存の化学基盤モデルに対しても、分子レベルおよび反応レベルの両方のタスクで一貫して優れた性能を示した。これらの結果は、Chem-Rの堅牢な汎化能力、解釈可能性、そして次世代のAI駆動型化学発見の基盤としての潜在能力を強調するものである。
English
Although large language models (LLMs) have significant potential to advance
chemical discovery, current LLMs lack core chemical knowledge, produce
unreliable reasoning trajectories, and exhibit suboptimal performance across
diverse chemical tasks. To address these challenges, we propose Chem-R, a
generalizable Chemical Reasoning model designed to emulate the deliberative
processes of chemists. Chem-R is trained through a three-phase framework that
progressively builds advanced reasoning capabilities, including: 1) Chemical
Foundation Training, which establishes core chemical knowledge. 2) Chemical
Reasoning Protocol Distillation, incorporating structured, expert-like
reasoning traces to guide systematic and reliable problem solving. 3)
Multi-task Group Relative Policy Optimization that optimizes the model for
balanced performance across diverse molecular- and reaction-level tasks. This
structured pipeline enables Chem-R to achieve state-of-the-art performance on
comprehensive benchmarks, surpassing leading large language models, including
Gemini-2.5-Pro and DeepSeek-R1, by up to 46% on molecular tasks and 66% on
reaction tasks. Meanwhile, Chem-R also consistently outperforms the existing
chemical foundation models across both molecular and reaction level tasks.
These results highlight Chem-R's robust generalization, interpretability, and
potential as a foundation for next-generation AI-driven chemical discovery.