ChatPaper.aiChatPaper

MolHIT:階層的離散拡散モデルによる分子グラフ生成の進展

MolHIT: Advancing Molecular-Graph Generation with Hierarchical Discrete Diffusion Models

February 19, 2026
著者: Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, Youngrok Park, Kyunggeun Roh, Se-Young Yun, Sehui Han, Dae-Woong Jeong
cs.AI

要旨

拡散モデルを用いた分子生成は、AI駆動の創薬や材料科学における有望な方向性として登場している。2D分子グラフの離散的な性質から、グラフ拡散モデルは広く採用されているが、既存モデルは化学的な妥当性が低く、1Dモデリングと比較して所望の特性を満たすのに苦労している。本研究では、既存手法の長年の性能限界を克服する強力な分子グラフ生成フレームワーク「MolHIT」を提案する。MolHITは階層的離散拡散モデルに基づいており、化学的な事前知識を符号化する追加カテゴリへの離散拡散の一般化と、化学的役割に応じて原子タイプを分割する分離原子符号化を特徴とする。全体として、MolHITはMOSESデータセットにおいてグラフ拡散では初めてほぼ完全な妥当性を達成し、複数の指標で強力な1Dベースラインを凌駕する新たな最先端性能を実現した。さらに、複数特性誘導生成や骨格拡張を含む下流タスクにおいても優れた性能を示す。
English
Molecular generation with diffusion models has emerged as a promising direction for AI-driven drug discovery and materials science. While graph diffusion models have been widely adopted due to the discrete nature of 2D molecular graphs, existing models suffer from low chemical validity and struggle to meet the desired properties compared to 1D modeling. In this work, we introduce MolHIT, a powerful molecular graph generation framework that overcomes long-standing performance limitations in existing methods. MolHIT is based on the Hierarchical Discrete Diffusion Model, which generalizes discrete diffusion to additional categories that encode chemical priors, and decoupled atom encoding that splits the atom types according to their chemical roles. Overall, MolHIT achieves new state-of-the-art performance on the MOSES dataset with near-perfect validity for the first time in graph diffusion, surpassing strong 1D baselines across multiple metrics. We further demonstrate strong performance in downstream tasks, including multi-property guided generation and scaffold extension.
PDF492February 27, 2026