Постоянное ускорение потока
Constant Acceleration Flow
November 1, 2024
Авторы: Dogyun Park, Sojin Lee, Sihyeon Kim, Taehoon Lee, Youngjoon Hong, Hyunwoo J. Kim
cs.AI
Аннотация
Процедуры прямого и обратного потока значительно продвинули быстрое поколение, постепенно выпрямляя обычные дифференциальные уравнения (ODE). Они работают с предположением, что изображения и пары шума, известные как связи, могут быть аппроксимированы прямыми траекториями с постоянной скоростью. Однако мы наблюдаем, что моделирование с постоянной скоростью и использование процедур обратного потока имеют ограничения в точном изучении прямых траекторий между парами, что приводит к субоптимальной производительности в генерации на несколько шагов. Для решения этих ограничений мы представляем Constant Acceleration Flow (CAF), новую структуру на основе простого уравнения постоянного ускорения. CAF вводит ускорение как дополнительную обучаемую переменную, позволяя более выразительную и точную оценку потока ODE. Более того, мы предлагаем две техники для дальнейшего улучшения точности оценки: начальное условие скорости для модели ускорения и процесс обратного потока для начальной скорости. Наши исчерпывающие исследования на игрушечных наборах данных, CIFAR-10 и ImageNet 64x64, показывают, что CAF превосходит современные базовые уровни для генерации на один шаг. Мы также показываем, что CAF значительно улучшает сохранение связей на несколько шагов и инверсию по сравнению с Rectified flow. Код доступен по ссылке https://github.com/mlvlab/CAF.
English
Rectified flow and reflow procedures have significantly advanced fast
generation by progressively straightening ordinary differential equation (ODE)
flows. They operate under the assumption that image and noise pairs, known as
couplings, can be approximated by straight trajectories with constant velocity.
However, we observe that modeling with constant velocity and using reflow
procedures have limitations in accurately learning straight trajectories
between pairs, resulting in suboptimal performance in few-step generation. To
address these limitations, we introduce Constant Acceleration Flow (CAF), a
novel framework based on a simple constant acceleration equation. CAF
introduces acceleration as an additional learnable variable, allowing for more
expressive and accurate estimation of the ODE flow. Moreover, we propose two
techniques to further improve estimation accuracy: initial velocity
conditioning for the acceleration model and a reflow process for the initial
velocity. Our comprehensive studies on toy datasets, CIFAR-10, and ImageNet
64x64 demonstrate that CAF outperforms state-of-the-art baselines for one-step
generation. We also show that CAF dramatically improves few-step coupling
preservation and inversion over Rectified flow. Code is available at
https://github.com/mlvlab/CAF{https://github.com/mlvlab/CAF}.Summary
AI-Generated Summary