MolSpectra: マルチモーダルエネルギースペクトルを用いた3D分子表現の事前学習
MolSpectra: Pre-training 3D Molecular Representation with Multi-modal Energy Spectra
February 22, 2025
著者: Liang Wang, Shaozhen Liu, Yu Rong, Deli Zhao, Qiang Liu, Shu Wu, Liang Wang
cs.AI
要旨
分子システムの3次元構造とエネルギー状態の関係を確立することは、3次元分子表現を学習するための有望なアプローチであることが証明されています。しかし、既存の手法は古典力学に基づく分子エネルギー状態のモデリングに限定されています。この制約により、量子力学的効果(例えば、離散的なエネルギー準位構造)の重要な見落としが生じています。これらの効果は分子エネルギーをより正確に推定し、エネルギースペクトルを通じて実験的に測定することが可能です。本論文では、エネルギースペクトルを活用して3次元分子表現(MolSpectra)の事前学習を強化し、量子力学の知識を分子表現に組み込むことを提案します。具体的には、マスクされたパッチ再構成を介して分子スペクトルをエンコードするマルチスペクトルエンコーダであるSpecFormerを提案します。さらに、3次元エンコーダとスペクトルエンコーダの出力を対照目的で整合させることで、3次元エンコーダの分子理解を強化します。公開ベンチマークでの評価により、我々の事前学習された表現が分子特性の予測やダイナミクスのモデリングにおいて既存の手法を凌駕することが明らかになりました。
English
Establishing the relationship between 3D structures and the energy states of
molecular systems has proven to be a promising approach for learning 3D
molecular representations. However, existing methods are limited to modeling
the molecular energy states from classical mechanics. This limitation results
in a significant oversight of quantum mechanical effects, such as quantized
(discrete) energy level structures, which offer a more accurate estimation of
molecular energy and can be experimentally measured through energy spectra. In
this paper, we propose to utilize the energy spectra to enhance the
pre-training of 3D molecular representations (MolSpectra), thereby infusing the
knowledge of quantum mechanics into the molecular representations.
Specifically, we propose SpecFormer, a multi-spectrum encoder for encoding
molecular spectra via masked patch reconstruction. By further aligning outputs
from the 3D encoder and spectrum encoder using a contrastive objective, we
enhance the 3D encoder's understanding of molecules. Evaluations on public
benchmarks reveal that our pre-trained representations surpass existing methods
in predicting molecular properties and modeling dynamics.Summary
AI-Generated Summary