DiffSpectra: 拡散モデルを用いたスペクトルからの分子構造解析
DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
July 9, 2025
著者: Liang Wang, Yu Rong, Tingyang Xu, Zhenyi Zhong, Zhiyuan Liu, Pengju Wang, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang
cs.AI
要旨
スペクトルからの分子構造解析は、化合物の同定、合成、薬剤開発において重要な基礎的な課題である。従来の手法は専門家の解釈に大きく依存しており、スケーラビリティに欠ける。先駆的な機械学習手法は検索ベースの戦略を導入したが、有限のライブラリに依存するため、新規分子への一般化が制限される。生成モデルは有望な代替手段を提供するが、その多くは3D幾何学を考慮せず、多様なスペクトルモダリティを統合するのが困難な自己回帰型SMILESベースのアーキテクチャを採用している。本研究では、拡散モデルを用いて多モーダルなスペクトルデータから直接2Dおよび3D分子構造を推論する生成フレームワーク、DiffSpectraを提案する。DiffSpectraは構造解析を条件付き生成プロセスとして定式化する。そのノイズ除去ネットワークは、トポロジカル情報と幾何学的情報を統合するSE(3)-等変アーキテクチャであるDiffusion Molecule Transformerによってパラメータ化される。条件付けは、多モーダルなスペクトルからスペクトル内およびスペクトル間の依存関係を捉えるトランスフォーマーベースのスペクトルエンコーダ、SpecFormerによって提供される。大規模な実験により、DiffSpectraが構造解析において高い精度を達成し、サンプリングを通じて16.01%のトップ1精度と96.86%のトップ20精度で正確な構造を復元することが示された。このモデルは、3D幾何学モデリング、SpecFormerの事前学習、および多モーダルな条件付けから大きな恩恵を受けている。これらの結果は、スペクトル条件付き拡散モデリングが分子構造解析の課題に取り組む上で有効であることを示している。私たちの知る限り、DiffSpectraは、多モーダルなスペクトル推論と2D/3D生成モデリングを統合し、de novo分子構造解析を行う初めてのフレームワークである。
English
Molecular structure elucidation from spectra is a foundational problem in
chemistry, with profound implications for compound identification, synthesis,
and drug development. Traditional methods rely heavily on expert interpretation
and lack scalability. Pioneering machine learning methods have introduced
retrieval-based strategies, but their reliance on finite libraries limits
generalization to novel molecules. Generative models offer a promising
alternative, yet most adopt autoregressive SMILES-based architectures that
overlook 3D geometry and struggle to integrate diverse spectral modalities. In
this work, we present DiffSpectra, a generative framework that directly infers
both 2D and 3D molecular structures from multi-modal spectral data using
diffusion models. DiffSpectra formulates structure elucidation as a conditional
generation process. Its denoising network is parameterized by Diffusion
Molecule Transformer, an SE(3)-equivariant architecture that integrates
topological and geometric information. Conditioning is provided by SpecFormer,
a transformer-based spectral encoder that captures intra- and inter-spectral
dependencies from multi-modal spectra. Extensive experiments demonstrate that
DiffSpectra achieves high accuracy in structure elucidation, recovering exact
structures with 16.01% top-1 accuracy and 96.86% top-20 accuracy through
sampling. The model benefits significantly from 3D geometric modeling,
SpecFormer pre-training, and multi-modal conditioning. These results highlight
the effectiveness of spectrum-conditioned diffusion modeling in addressing the
challenge of molecular structure elucidation. To our knowledge, DiffSpectra is
the first framework to unify multi-modal spectral reasoning and joint 2D/3D
generative modeling for de novo molecular structure elucidation.