ChatPaper.aiChatPaper

Chem-R: 化学者として推論することを学ぶ

Chem-R: Learning to Reason as a Chemist

October 19, 2025
著者: Weida Wang, Benteng Chen, Di Zhang, Wanhao Liu, Shuchen Pu, Ben Gao, Jin Zeng, Lei Bai, Wanli Ouyang, Xiaoyong Wei, Tianshu Yu, Tianfan Fu, Shuzhou Sun, Jiatong Li, Zifu Wang, Yuqiang Li, Shufei Zhang
cs.AI

要旨

大規模言語モデル(LLM)は化学発見を進展させる大きな可能性を秘めているものの、現状のLLMは核心的な化学知識を欠き、信頼性の低い推論プロセスを生成し、多様な化学タスクにおいて最適な性能を発揮できていない。これらの課題に対処するため、我々はChem-Rを提案する。これは化学者の熟慮プロセスを模倣するように設計された、汎用性の高い化学推論モデルである。Chem-Rは、高度な推論能力を段階的に構築する3段階のフレームワークを通じて訓練される。具体的には、1)化学基礎訓練:核心的な化学知識を確立する、2)化学推論プロトコル蒸留:体系的な信頼性の高い問題解決を導くために、構造化された専門家のような推論トレースを組み込む、3)マルチタスクグループ相対ポリシー最適化:分子レベルおよび反応レベルの多様なタスクにおいてバランスの取れた性能を最適化する。この構造化されたパイプラインにより、Chem-Rは包括的なベンチマークにおいて最先端の性能を達成し、分子タスクでは最大46%、反応タスクでは最大66%の性能向上でGemini-2.5-ProやDeepSeek-R1などの主要な大規模言語モデルを凌駕した。同時に、Chem-Rは既存の化学基盤モデルに対しても、分子レベルおよび反応レベルの両方のタスクで一貫して優れた性能を示した。これらの結果は、Chem-Rの堅牢な汎化能力、解釈可能性、そして次世代のAI駆動型化学発見の基盤としての潜在能力を強調するものである。
English
Although large language models (LLMs) have significant potential to advance chemical discovery, current LLMs lack core chemical knowledge, produce unreliable reasoning trajectories, and exhibit suboptimal performance across diverse chemical tasks. To address these challenges, we propose Chem-R, a generalizable Chemical Reasoning model designed to emulate the deliberative processes of chemists. Chem-R is trained through a three-phase framework that progressively builds advanced reasoning capabilities, including: 1) Chemical Foundation Training, which establishes core chemical knowledge. 2) Chemical Reasoning Protocol Distillation, incorporating structured, expert-like reasoning traces to guide systematic and reliable problem solving. 3) Multi-task Group Relative Policy Optimization that optimizes the model for balanced performance across diverse molecular- and reaction-level tasks. This structured pipeline enables Chem-R to achieve state-of-the-art performance on comprehensive benchmarks, surpassing leading large language models, including Gemini-2.5-Pro and DeepSeek-R1, by up to 46% on molecular tasks and 66% on reaction tasks. Meanwhile, Chem-R also consistently outperforms the existing chemical foundation models across both molecular and reaction level tasks. These results highlight Chem-R's robust generalization, interpretability, and potential as a foundation for next-generation AI-driven chemical discovery.
PDF503October 22, 2025