DiffSpectra: Moleculaire Structuuropheldering uit Spectra met behulp van Diffusiemodellen
DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
July 9, 2025
Auteurs: Liang Wang, Yu Rong, Tingyang Xu, Zhenyi Zhong, Zhiyuan Liu, Pengju Wang, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang
cs.AI
Samenvatting
Het ophelderen van moleculaire structuren uit spectra is een fundamenteel probleem in de scheikunde, met verstrekkende implicaties voor stofidentificatie, synthese en medicijnontwikkeling. Traditionele methoden zijn sterk afhankelijk van expertinterpretatie en schieten tekort in schaalbaarheid. Baanbrekende machine learning-methoden hebben op retrieval gebaseerde strategieën geïntroduceerd, maar hun afhankelijkheid van eindige bibliotheken beperkt de generalisatie naar nieuwe moleculen. Generatieve modellen bieden een veelbelovend alternatief, maar de meeste gebruiken autoregressieve SMILES-gebaseerde architecturen die 3D-geometrie negeren en moeite hebben met het integreren van diverse spectrale modaliteiten. In dit werk presenteren we DiffSpectra, een generatief raamwerk dat zowel 2D- als 3D-moleculaire structuren rechtstreeks afleidt uit multi-modale spectrale data met behulp van diffusiemodellen. DiffSpectra formuleert structuuropheldering als een conditioneel generatieproces. Het denoiserende netwerk is geparametriseerd door Diffusion Molecule Transformer, een SE(3)-equivariante architectuur die topologische en geometrische informatie integreert. Conditionering wordt verzorgd door SpecFormer, een transformer-gebaseerde spectrale encoder die intra- en inter-spectrale afhankelijkheden vastlegt uit multi-modale spectra. Uitgebreide experimenten tonen aan dat DiffSpectra een hoge nauwkeurigheid bereikt in structuuropheldering, met exacte structuren die in 16,01% van de gevallen als top-1 en in 96,86% als top-20 worden teruggevonden via sampling. Het model profiteert aanzienlijk van 3D-geometrische modellering, SpecFormer pre-training en multi-modale conditionering. Deze resultaten benadrukken de effectiviteit van spectrum-geconditioneerde diffusiemodellering bij het aanpakken van de uitdaging van moleculaire structuuropheldering. Voor zover wij weten, is DiffSpectra het eerste raamwerk dat multi-modale spectrale redenering en gezamenlijke 2D/3D generatieve modellering verenigt voor de novo moleculaire structuuropheldering.
English
Molecular structure elucidation from spectra is a foundational problem in
chemistry, with profound implications for compound identification, synthesis,
and drug development. Traditional methods rely heavily on expert interpretation
and lack scalability. Pioneering machine learning methods have introduced
retrieval-based strategies, but their reliance on finite libraries limits
generalization to novel molecules. Generative models offer a promising
alternative, yet most adopt autoregressive SMILES-based architectures that
overlook 3D geometry and struggle to integrate diverse spectral modalities. In
this work, we present DiffSpectra, a generative framework that directly infers
both 2D and 3D molecular structures from multi-modal spectral data using
diffusion models. DiffSpectra formulates structure elucidation as a conditional
generation process. Its denoising network is parameterized by Diffusion
Molecule Transformer, an SE(3)-equivariant architecture that integrates
topological and geometric information. Conditioning is provided by SpecFormer,
a transformer-based spectral encoder that captures intra- and inter-spectral
dependencies from multi-modal spectra. Extensive experiments demonstrate that
DiffSpectra achieves high accuracy in structure elucidation, recovering exact
structures with 16.01% top-1 accuracy and 96.86% top-20 accuracy through
sampling. The model benefits significantly from 3D geometric modeling,
SpecFormer pre-training, and multi-modal conditioning. These results highlight
the effectiveness of spectrum-conditioned diffusion modeling in addressing the
challenge of molecular structure elucidation. To our knowledge, DiffSpectra is
the first framework to unify multi-modal spectral reasoning and joint 2D/3D
generative modeling for de novo molecular structure elucidation.