ReQFlow: Fluxo Quaterniônico Retificado para Geração Eficiente e de Alta Qualidade de Estruturas Proteicas
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
Autores: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
Resumo
A geração de esqueletos proteicos desempenha um papel central no design de novo de proteínas e é significativa para muitas aplicações biológicas e médicas. Embora modelos generativos baseados em difusão e fluxo ofereçam soluções potenciais para essa tarefa desafiadora, eles frequentemente geram proteínas com designabilidade indesejada e sofrem de ineficiência computacional. Neste estudo, propomos um novo método de correspondência de fluxo quaterniônico retificado (ReQFlow) para a geração rápida e de alta qualidade de esqueletos proteicos. Em particular, nosso método gera uma translação local e uma rotação 3D a partir de ruído aleatório para cada resíduo em uma cadeia proteica, representando cada rotação 3D como um quaternião unitário e construindo seu fluxo por interpolação linear esférica (SLERP) em um formato exponencial. Treinamos o modelo por correspondência de fluxo quaterniônico (QFlow) com estabilidade numérica garantida e retificamos o modelo QFlow para acelerar sua inferência e melhorar a designabilidade dos esqueletos proteicos gerados, resultando no modelo ReQFlow proposto. Experimentos mostram que o ReQFlow alcança desempenho de ponta na geração de esqueletos proteicos, exigindo muito menos etapas de amostragem e significativamente menos tempo de inferência (por exemplo, sendo 37x mais rápido que o RFDiffusion e 62x mais rápido que o Genie2 ao gerar um esqueleto de comprimento 300), demonstrando sua eficácia e eficiência. O código está disponível em https://github.com/AngxiaoYue/ReQFlow.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary