ReQFlow: Flusso Quaternionico Rettificato per la Generazione Efficiente e di Alta Qualità della Struttura Proteica
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
Autori: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
Abstract
La generazione della struttura proteica svolge un ruolo centrale nel design de novo delle proteine ed è significativa per molte applicazioni biologiche e mediche. Sebbene i modelli generativi basati su diffusione e flusso offrano soluzioni potenziali a questo compito impegnativo, spesso generano proteine con una desiderabilità non ottimale e soffrono di inefficienza computazionale. In questo studio, proponiamo un nuovo metodo di matching del flusso quaternion rettificato (ReQFlow) per la generazione rapida e di alta qualità della struttura proteica. In particolare, il nostro metodo genera una traslazione locale e una rotazione 3D da rumore casuale per ciascun residuo in una catena proteica, rappresentando ciascuna rotazione 3D come un quaternion unitario e costruendo il suo flusso mediante interpolazione lineare sferica (SLERP) in formato esponenziale. Addestriamo il modello mediante matching del flusso quaternion (QFlow) con stabilità numerica garantita e rettifichiamo il modello QFlow per accelerarne l'inferenza e migliorare la desiderabilità delle strutture proteiche generate, portando al modello ReQFlow proposto. Gli esperimenti dimostrano che ReQFlow raggiunge prestazioni all'avanguardia nella generazione della struttura proteica, richiedendo molti meno passi di campionamento e un tempo di inferenza significativamente ridotto (ad esempio, 37 volte più veloce di RFDiffusion e 62 volte più veloce di Genie2 nella generazione di una struttura di lunghezza 300), dimostrandone l'efficacia e l'efficienza. Il codice è disponibile all'indirizzo https://github.com/AngxiaoYue/ReQFlow.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary