CAR-Flow: Reprocesamiento Condicional Alinea Fuente y Objetivo para una Mejor Coincidencia de Flujo
CAR-Flow: Condition-Aware Reparameterization Aligns Source and Target for Better Flow Matching
September 23, 2025
Autores: Chen Chen, Pengsheng Guo, Liangchen Song, Jiasen Lu, Rui Qian, Xinze Wang, Tsu-Jui Fu, Wei Liu, Yinfei Yang, Alex Schwing
cs.AI
Resumen
El modelado generativo condicional tiene como objetivo aprender una distribución de datos condicional a partir de muestras que contienen pares de datos-condición. Para ello, los métodos basados en difusión y flujo han obtenido resultados convincentes. Estos métodos utilizan un modelo (de flujo) aprendido para transportar un ruido gaussiano estándar inicial que ignora la condición hacia la distribución de datos condicional. Por lo tanto, el modelo debe aprender tanto el transporte de masa como la inyección condicional. Para reducir la demanda sobre el modelo, proponemos la Reparametrización Consciente de la Condición para Emparejamiento de Flujo (CAR-Flow, por sus siglas en inglés): un desplazamiento ligero y aprendido que condiciona la fuente, el objetivo o ambas distribuciones. Al reubicar estas distribuciones, CAR-Flow acorta la trayectoria de probabilidad que el modelo debe aprender, lo que conduce a un entrenamiento más rápido en la práctica. En datos sintéticos de baja dimensión, visualizamos y cuantificamos los efectos de CAR. En datos de imágenes naturales de mayor dimensión (ImageNet-256), equipar SiT-XL/2 con CAR-Flow reduce el FID de 2.07 a 1.68, mientras introduce menos del 0.6% de parámetros adicionales.
English
Conditional generative modeling aims to learn a conditional data distribution
from samples containing data-condition pairs. For this, diffusion and
flow-based methods have attained compelling results. These methods use a
learned (flow) model to transport an initial standard Gaussian noise that
ignores the condition to the conditional data distribution. The model is hence
required to learn both mass transport and conditional injection. To ease the
demand on the model, we propose Condition-Aware Reparameterization for Flow
Matching (CAR-Flow) -- a lightweight, learned shift that conditions the source,
the target, or both distributions. By relocating these distributions, CAR-Flow
shortens the probability path the model must learn, leading to faster training
in practice. On low-dimensional synthetic data, we visualize and quantify the
effects of CAR. On higher-dimensional natural image data (ImageNet-256),
equipping SiT-XL/2 with CAR-Flow reduces FID from 2.07 to 1.68, while
introducing less than 0.6% additional parameters.