一定加速度フロー
Constant Acceleration Flow
November 1, 2024
著者: Dogyun Park, Sojin Lee, Sihyeon Kim, Taehoon Lee, Youngjoon Hong, Hyunwoo J. Kim
cs.AI
要旨
修正フローと再流フロー手法は、普通の微分方程式(ODE)フローを徐々に直線化することで、高速生成を著しく進化させてきました。これらは、画像とノイズのペアであるカップリングが、一定の速度で直線的な軌跡で近似できるという仮定の下で動作します。しかし、一定の速度でモデリングを行い、再流手法を使用することは、ペア間の直線的な軌跡を正確に学習する際に制約があり、数段の生成において最適でないパフォーマンスをもたらします。これらの制約に対処するために、我々は定加速度フロー(CAF)を導入します。これは、単純な一定加速度方程式に基づく新しいフレームワークです。CAFは、加速度を追加の学習可能な変数として導入し、ODEフローのより表現豊かで正確な推定を可能にします。さらに、加速度モデルの初速条件化と初速のための再流プロセスを提案します。おもちゃのデータセット、CIFAR-10、およびImageNet 64x64に関する包括的な研究により、CAFが1段階生成において最先端のベースラインを上回ることが示されました。また、CAFが、数段のカップリング保存と逆変換をRectified flowよりも劇的に改善することも示されました。コードはhttps://github.com/mlvlab/CAF{https://github.com/mlvlab/CAF}で入手可能です。
English
Rectified flow and reflow procedures have significantly advanced fast
generation by progressively straightening ordinary differential equation (ODE)
flows. They operate under the assumption that image and noise pairs, known as
couplings, can be approximated by straight trajectories with constant velocity.
However, we observe that modeling with constant velocity and using reflow
procedures have limitations in accurately learning straight trajectories
between pairs, resulting in suboptimal performance in few-step generation. To
address these limitations, we introduce Constant Acceleration Flow (CAF), a
novel framework based on a simple constant acceleration equation. CAF
introduces acceleration as an additional learnable variable, allowing for more
expressive and accurate estimation of the ODE flow. Moreover, we propose two
techniques to further improve estimation accuracy: initial velocity
conditioning for the acceleration model and a reflow process for the initial
velocity. Our comprehensive studies on toy datasets, CIFAR-10, and ImageNet
64x64 demonstrate that CAF outperforms state-of-the-art baselines for one-step
generation. We also show that CAF dramatically improves few-step coupling
preservation and inversion over Rectified flow. Code is available at
https://github.com/mlvlab/CAF{https://github.com/mlvlab/CAF}.Summary
AI-Generated Summary