ReQFlow: Flujo Cuaterniónico Rectificado para la Generación Eficiente y de Alta Calidad de Esqueletos Proteicos
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
Autores: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
Resumen
La generación de la estructura principal de proteínas desempeña un papel central en el diseño de novo de proteínas y es significativa para muchas aplicaciones biológicas y médicas. Aunque los modelos generativos basados en difusión y flujo ofrecen soluciones potenciales para esta tarea desafiante, a menudo generan proteínas con una deseabilidad limitada y presentan ineficiencias computacionales. En este estudio, proponemos un novedoso método de ajuste de flujo de cuaterniones rectificado (ReQFlow) para la generación rápida y de alta calidad de la estructura principal de proteínas. En particular, nuestro método genera una traslación local y una rotación 3D a partir de ruido aleatorio para cada residuo en una cadena proteica, representando cada rotación 3D como un cuaternión unitario y construyendo su flujo mediante interpolación lineal esférica (SLERP) en formato exponencial. Entrenamos el modelo mediante ajuste de flujo de cuaterniones (QFlow) con estabilidad numérica garantizada y rectificamos el modelo QFlow para acelerar su inferencia y mejorar la deseabilidad de las estructuras principales de proteínas generadas, dando lugar al modelo ReQFlow propuesto. Los experimentos muestran que ReQFlow alcanza un rendimiento de vanguardia en la generación de estructuras principales de proteínas, requiriendo muchos menos pasos de muestreo y un tiempo de inferencia significativamente menor (por ejemplo, siendo 37 veces más rápido que RFDiffusion y 62 veces más rápido que Genie2 al generar una estructura principal de longitud 300), demostrando su eficacia y eficiencia. El código está disponible en https://github.com/AngxiaoYue/ReQFlow.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary