ReQFlow: Rectifizierter Quaternionen-Fluss für effiziente und hochwertige Protein-Rückgratgenerierung
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
Autoren: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
Zusammenfassung
Die Generierung von Proteinrückgraten spielt eine zentrale Rolle im de novo Protein-Design und ist von großer Bedeutung für viele biologische und medizinische Anwendungen. Obwohl Diffusions- und flussbasierte generative Modelle potenzielle Lösungen für diese anspruchsvolle Aufgabe bieten, erzeugen sie oft Proteine mit unerwünschter Designierbarkeit und leiden unter rechnerischer Ineffizienz. In dieser Studie schlagen wir eine neuartige Methode des rectified quaternion flow (ReQFlow) matching vor, die eine schnelle und hochwertige Generierung von Proteinrückgraten ermöglicht. Insbesondere generiert unsere Methode eine lokale Translation und eine 3D-Rotation aus zufälligem Rauschen für jedes Residuum in einer Proteinkette, wobei jede 3D-Rotation als Einheitsquaternion dargestellt und ihr Fluss durch sphärische lineare Interpolation (SLERP) in einem exponentiellen Format konstruiert wird. Wir trainieren das Modell durch quaternion flow (QFlow) matching mit garantierter numerischer Stabilität und korrigieren das QFlow-Modell, um dessen Inferenz zu beschleunigen und die Designierbarkeit der generierten Proteinrückgrate zu verbessern, was zum vorgeschlagenen ReQFlow-Modell führt. Experimente zeigen, dass ReQFlow bei der Generierung von Proteinrückgraten Spitzenleistungen erzielt, während es deutlich weniger Abtastschritte und erheblich weniger Inferenzzeit erfordert (z. B. ist es 37-mal schneller als RFDiffusion und 62-mal schneller als Genie2 bei der Generierung eines Rückgrats der Länge 300), was seine Effektivität und Effizienz unterstreicht. Der Code ist verfügbar unter https://github.com/AngxiaoYue/ReQFlow.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary