ReQFlow: 効率的かつ高品質なタンパク質バックボーン生成のための整流クォータニオンフロー
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
著者: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
要旨
タンパク質バックボーン生成は、デノボタンパク質設計において中心的な役割を果たし、多くの生物学的および医学的応用において重要である。拡散モデルやフローベースの生成モデルはこの困難な課題に対する潜在的な解決策を提供するが、しばしば望ましい設計可能性を持たないタンパク質を生成し、計算効率が低いという問題がある。本研究では、高速かつ高品質なタンパク質バックボーン生成のための新しい修正四元数フロー(ReQFlow)マッチング法を提案する。特に、本手法はタンパク質鎖の各残基に対して、ランダムノイズから局所的な並進と3D回転を生成し、各3D回転を単位四元数として表現し、指数形式での球面線形補間(SLERP)によってそのフローを構築する。本モデルは、数値的安定性が保証された四元数フロー(QFlow)マッチングによって訓練され、QFlowモデルを修正して推論を加速し、生成されたタンパク質バックボーンの設計可能性を向上させることで、提案するReQFlowモデルを導出する。実験結果は、ReQFlowがタンパク質バックボーン生成において最先端の性能を達成し、サンプリングステップ数を大幅に削減し、推論時間を著しく短縮する(例えば、長さ300のバックボーンを生成する際にRFDiffusionよりも37倍、Genie2よりも62倍高速である)ことを示しており、その有効性と効率性を実証している。コードはhttps://github.com/AngxiaoYue/ReQFlowで公開されている。
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary