DiffSpectra: Определение молекулярной структуры по спектрам с использованием моделей диффузии
DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models
July 9, 2025
Авторы: Liang Wang, Yu Rong, Tingyang Xu, Zhenyi Zhong, Zhiyuan Liu, Pengju Wang, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang
cs.AI
Аннотация
Определение молекулярной структуры по спектрам является фундаментальной задачей в химии, имеющей важное значение для идентификации соединений, их синтеза и разработки лекарств. Традиционные методы в значительной степени зависят от экспертной интерпретации и не обладают масштабируемостью. Пионерские методы машинного обучения предложили стратегии, основанные на поиске, но их зависимость от ограниченных библиотек ограничивает обобщение на новые молекулы. Генеративные модели представляют собой многообещающую альтернативу, однако большинство из них используют авторегрессивные архитектуры на основе SMILES, которые игнорируют трехмерную геометрию и испытывают трудности с интеграцией различных спектральных модальностей. В данной работе мы представляем DiffSpectra, генеративную структуру, которая напрямую выводит как 2D, так и 3D молекулярные структуры из мультимодальных спектральных данных с использованием диффузионных моделей. DiffSpectra формулирует задачу определения структуры как процесс условной генерации. Ее сеть для удаления шума параметризована Diffusion Molecule Transformer, SE(3)-эквивариантной архитектурой, которая интегрирует топологическую и геометрическую информацию. Условие задается SpecFormer, трансформерным спектральным кодировщиком, который учитывает внутри- и межспектральные зависимости в мультимодальных спектрах. Обширные эксперименты демонстрируют, что DiffSpectra достигает высокой точности в определении структуры, восстанавливая точные структуры с точностью 16.01% в топ-1 и 96.86% в топ-20 при использовании сэмплирования. Модель значительно выигрывает от трехмерного геометрического моделирования, предварительного обучения SpecFormer и мультимодального условного задания. Эти результаты подчеркивают эффективность диффузионного моделирования, обусловленного спектрами, в решении задачи определения молекулярной структуры. Насколько нам известно, DiffSpectra является первой структурой, объединяющей мультимодальное спектральное рассуждение и совместное генеративное моделирование 2D/3D для определения молекулярной структуры de novo.
English
Molecular structure elucidation from spectra is a foundational problem in
chemistry, with profound implications for compound identification, synthesis,
and drug development. Traditional methods rely heavily on expert interpretation
and lack scalability. Pioneering machine learning methods have introduced
retrieval-based strategies, but their reliance on finite libraries limits
generalization to novel molecules. Generative models offer a promising
alternative, yet most adopt autoregressive SMILES-based architectures that
overlook 3D geometry and struggle to integrate diverse spectral modalities. In
this work, we present DiffSpectra, a generative framework that directly infers
both 2D and 3D molecular structures from multi-modal spectral data using
diffusion models. DiffSpectra formulates structure elucidation as a conditional
generation process. Its denoising network is parameterized by Diffusion
Molecule Transformer, an SE(3)-equivariant architecture that integrates
topological and geometric information. Conditioning is provided by SpecFormer,
a transformer-based spectral encoder that captures intra- and inter-spectral
dependencies from multi-modal spectra. Extensive experiments demonstrate that
DiffSpectra achieves high accuracy in structure elucidation, recovering exact
structures with 16.01% top-1 accuracy and 96.86% top-20 accuracy through
sampling. The model benefits significantly from 3D geometric modeling,
SpecFormer pre-training, and multi-modal conditioning. These results highlight
the effectiveness of spectrum-conditioned diffusion modeling in addressing the
challenge of molecular structure elucidation. To our knowledge, DiffSpectra is
the first framework to unify multi-modal spectral reasoning and joint 2D/3D
generative modeling for de novo molecular structure elucidation.