ReQFlow: 효율적이고 고품질의 단백질 백본 생성을 위한 정류 사원수 플로우
ReQFlow: Rectified Quaternion Flow for Efficient and High-Quality Protein Backbone Generation
February 20, 2025
저자: Angxiao Yue, Zichong Wang, Hongteng Xu
cs.AI
초록
단백질 골격 생성은 데노보 단백질 설계에서 핵심적인 역할을 하며, 다양한 생물학적 및 의학적 응용 분야에서 중요한 의미를 가집니다. 확산 및 흐름 기반 생성 모델들은 이 어려운 과제에 대한 잠재적인 해결책을 제공하지만, 종종 바람직하지 않은 설계 가능성을 가진 단백질을 생성하거나 계산 비효율성을 겪습니다. 본 연구에서는 빠르고 고품질의 단백질 골격 생성을 위한 새로운 정류 쿼터니언 흐름(ReQFlow) 매칭 방법을 제안합니다. 특히, 우리의 방법은 단백질 사슬 내 각 잔기에 대해 무작위 노이즈로부터 국소적 이동과 3D 회전을 생성하며, 각 3D 회전을 단위 쿼터니언으로 표현하고 지수 형식의 구면 선형 보간(SLERP)을 통해 흐름을 구성합니다. 우리는 수치적 안정성이 보장된 쿼터니언 흐름(QFlow) 매칭을 통해 모델을 학습시키고, QFlow 모델을 정류하여 추론 속도를 가속화하고 생성된 단백질 골격의 설계 가능성을 개선함으로써 제안된 ReQFlow 모델을 도출했습니다. 실험 결과, ReQFlow는 단백질 골격 생성에서 최첨단 성능을 달성하면서도 훨씬 적은 샘플링 단계와 상당히 짧은 추론 시간(예: 길이 300의 골격 생성 시 RFDiffusion보다 37배, Genie2보다 62배 빠름)을 요구하여 그 효과성과 효율성을 입증했습니다. 코드는 https://github.com/AngxiaoYue/ReQFlow에서 확인할 수 있습니다.
English
Protein backbone generation plays a central role in de novo protein design
and is significant for many biological and medical applications. Although
diffusion and flow-based generative models provide potential solutions to this
challenging task, they often generate proteins with undesired designability and
suffer computational inefficiency. In this study, we propose a novel rectified
quaternion flow (ReQFlow) matching method for fast and high-quality protein
backbone generation. In particular, our method generates a local translation
and a 3D rotation from random noise for each residue in a protein chain, which
represents each 3D rotation as a unit quaternion and constructs its flow by
spherical linear interpolation (SLERP) in an exponential format. We train the
model by quaternion flow (QFlow) matching with guaranteed numerical stability
and rectify the QFlow model to accelerate its inference and improve the
designability of generated protein backbones, leading to the proposed ReQFlow
model. Experiments show that ReQFlow achieves state-of-the-art performance in
protein backbone generation while requiring much fewer sampling steps and
significantly less inference time (e.g., being 37x faster than RFDiffusion and
62x faster than Genie2 when generating a backbone of length 300), demonstrating
its effectiveness and efficiency. The code is available at
https://github.com/AngxiaoYue/ReQFlow.Summary
AI-Generated Summary