Abstract We introduce ReQFlow, a novel rectified quaternion flow model for generating high-quality protein backbone structures efficiently. ReQFlow leverages quaternion representations to model the 3D rotations of protein backbones, enabling more accurate and physically plausible generation compared to existing methods. The rectification mechanism ensures stable training and improved sample quality by addressing common issues in flow-based models. Extensive experiments demonstrate that ReQFlow outperforms state-of-the-art approaches in terms of both generation quality and computational efficiency. Our model achieves significant improvements in key metrics such as RMSD and TM-score while requiring substantially less computation time. These results highlight the potential of ReQFlow as a powerful tool for protein structure prediction and design.
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
Auteurs: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
Résumé
La génération de la structure principale des protéines joue un rôle central dans la conception de novo des protéines et revêt une importance majeure pour de nombreuses applications biologiques et médicales. Bien que les modèles génératifs basés sur la diffusion et les flux offrent des solutions potentielles à cette tâche complexe, ils génèrent souvent des protéines avec une désirabilité insuffisante et souffrent d'une inefficacité computationnelle. Dans cette étude, nous proposons une nouvelle méthode de correspondance de flux de quaternions rectifiés (ReQFlow) pour une génération rapide et de haute qualité de la structure principale des protéines. Plus précisément, notre méthode génère une translation locale et une rotation 3D à partir d'un bruit aléatoire pour chaque résidu d'une chaîne protéique, représentant chaque rotation 3D sous forme d'un quaternion unitaire et construisant son flux par interpolation linéaire sphérique (SLERP) dans un format exponentiel. Nous entraînons le modèle par correspondance de flux de quaternions (QFlow) avec une stabilité numérique garantie et rectifions le modèle QFlow pour accélérer son inférence et améliorer la désirabilité des structures principales de protéines générées, aboutissant au modèle ReQFlow proposé. Les expériences montrent que ReQFlow atteint des performances de pointe dans la génération de la structure principale des protéines tout en nécessitant beaucoup moins d'étapes d'échantillonnage et un temps d'inférence significativement réduit (par exemple, étant 37 fois plus rapide que RFDiffusion et 62 fois plus rapide que Genie2 lors de la génération d'une structure principale de longueur 300), démontrant ainsi son efficacité et son efficience. Le code est disponible à l'adresse suivante : https://github.com/AngxiaoYue/ReQFlow.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary