더 직관적이고 빠르게: 정규화된 궤적에서의 MeanFlow를 통한 효율적인 일단계 생성 모델링
Flow Straighter and Faster: Efficient One-Step Generative Modeling via MeanFlow on Rectified Trajectories
November 28, 2025
저자: Xinxi Zhang, Shiwei Tan, Quang Nguyen, Quan Dao, Ligong Han, Xiaoxiao He, Tunyu Zhang, Alen Mrdovic, Dimitris Metaxas
cs.AI
초록
Flow 기반 생성 모델은 최근 강력한 성능을 보여주고 있지만, 샘플링에는 일반적으로 비용이 많이 드는 상미분방정식(ODE)의 수치적분이 필요합니다. Rectified Flow는 거의 직선적인 확률 경로를 학습함으로써 원샷 샘플링을 가능하게 하지만, 이러한 직선성을 달성하기 위해서는 계산량이 많은 여러 번의 리플로우(reflow) 반복이 필요합니다. MeanFlow는 시간에 따른 평균 속도를 직접 모델링하여 원샷 생성을 달성하지만, 곡률이 높은 흐름에서 학습할 경우 수렴 속도가 느리고 노이즈가 많은 지도 신호로 인해 어려움을 겪습니다. 이러한 한계를 해결하기 위해 우리는 단일 리플로우 단계만을 사용하여 정류된(rectified) 궤적을 따라 평균 속도장을 모델링하는 프레임워크인 Rectified MeanFlow를 제안합니다. 이는 완벽하게 직선화된 궤적을 필요로 하지 않으면서도 효율적인 학습을 가능하게 합니다. 더 나아가, 잔여 곡률을 줄이고 성능을 추가로 개선하기 위한 간단하면서 효과적인 트렁케이션 휴리스틱을 도입합니다. 64, 256, 512 해상도의 ImageNet에 대한 대규모 실험을 통해 Re-MeanFlow가 샘플 품질과 학습 효율성 모두에서 기존의 원샷 플로우 디스틸레이션(flow distillation) 및 Rectified Flow 방법들을 지속적으로 능가함을 보여줍니다. 코드는 https://github.com/Xinxi-Zhang/Re-MeanFlow에서 확인할 수 있습니다.
English
Flow-based generative models have recently demonstrated strong performance, yet sampling typically relies on expensive numerical integration of ordinary differential equations (ODEs). Rectified Flow enables one-step sampling by learning nearly straight probability paths, but achieving such straightness requires multiple computationally intensive reflow iterations. MeanFlow achieves one-step generation by directly modeling the average velocity over time; however, when trained on highly curved flows, it suffers from slow convergence and noisy supervision. To address these limitations, we propose Rectified MeanFlow, a framework that models the mean velocity field along the rectified trajectory using only a single reflow step. This eliminates the need for perfectly straightened trajectories while enabling efficient training. Furthermore, we introduce a simple yet effective truncation heuristic that aims to reduce residual curvature and further improve performance. Extensive experiments on ImageNet at 64, 256, and 512 resolutions show that Re-MeanFlow consistently outperforms prior one-step flow distillation and Rectified Flow methods in both sample quality and training efficiency. Code is available at https://github.com/Xinxi-Zhang/Re-MeanFlow.