ChatPaper.aiChatPaper

M^4olGen: 精密な多特性制約下でのマルチエージェント・マルチステージ分子生成

M^4olGen: Multi-Agent, Multi-Stage Molecular Generation under Precise Multi-Property Constraints

January 15, 2026
著者: Yizhan Li, Florence Cloutier, Sifan Wu, Ali Parviz, Boris Knyazev, Yan Zhang, Glen Berseth, Bang Liu
cs.AI

要旨

精密な数値制約を満たす分子の生成は、複数の物理化学的特性において重要かつ困難な課題である。大規模言語モデル(LLM)は表現力に優れるが、外部の構造やフィードバックなしでは、精密な多目的制御や数値推論に課題がある。本論文では、多特性制約下での分子生成のためのフラグメントレベル・検索拡張・二段階フレームワークであるMolGenを提案する。**第I段階:プロトタイプ生成**では、マルチエージェント推論器が検索に基づくフラグメントレベルの編集を行い、実行可能領域近傍の候補分子を生成する。**第II段階:強化学習に基づく微細最適化**では、Group Relative Policy Optimization(GRPO)で訓練されたフラグメントレベル最適化器が、1ホップまたはマルチホップの精密化を適用し、編集の複雑さとプロトタイプからの逸脱を調整しながら、目標値に対する特性誤差を明示的に最小化する。両段階を支えるのは、フラグメント編集の推論連鎖と測定された特性変化量を自動収録した大規模データセットであり、確定的で再現性のある監督と制御可能なマルチホップ推論を可能にする。従来研究と異なり、本フレームワークはフラグメントを活用することで分子をより良く推論し、数値目標への制御可能な精密化を支援する。2組の特性制約(QED、LogP、分子量とHOMO、LUMO)下での生成実験において、有効性と多特性目標の精密な満足度において一貫した改善を示し、強力なLLMおよびグラフベース手法を凌駕する結果を得た。
English
Generating molecules that satisfy precise numeric constraints over multiple physicochemical properties is critical and challenging. Although large language models (LLMs) are expressive, they struggle with precise multi-objective control and numeric reasoning without external structure and feedback. We introduce M olGen, a fragment-level, retrieval-augmented, two-stage framework for molecule generation under multi-property constraints. Stage I : Prototype generation: a multi-agent reasoner performs retrieval-anchored, fragment-level edits to produce a candidate near the feasible region. Stage II : RL-based fine-grained optimization: a fragment-level optimizer trained with Group Relative Policy Optimization (GRPO) applies one- or multi-hop refinements to explicitly minimize the property errors toward our target while regulating edit complexity and deviation from the prototype. A large, automatically curated dataset with reasoning chains of fragment edits and measured property deltas underpins both stages, enabling deterministic, reproducible supervision and controllable multi-hop reasoning. Unlike prior work, our framework better reasons about molecules by leveraging fragments and supports controllable refinement toward numeric targets. Experiments on generation under two sets of property constraints (QED, LogP, Molecular Weight and HOMO, LUMO) show consistent gains in validity and precise satisfaction of multi-property targets, outperforming strong LLMs and graph-based algorithms.
PDF91January 17, 2026