CAR-Flow : Reparamétrisation Conditionnelle Aligne Source et Cible pour un Meilleur Appariement de Flux
CAR-Flow: Condition-Aware Reparameterization Aligns Source and Target for Better Flow Matching
September 23, 2025
papers.authors: Chen Chen, Pengsheng Guo, Liangchen Song, Jiasen Lu, Rui Qian, Xinze Wang, Tsu-Jui Fu, Wei Liu, Yinfei Yang, Alex Schwing
cs.AI
papers.abstract
La modélisation générative conditionnelle vise à apprendre une distribution de données conditionnelle à partir d'échantillons contenant des paires données-conditions. Pour cela, les méthodes basées sur la diffusion et les flux ont obtenu des résultats convaincants. Ces méthodes utilisent un modèle de flux appris pour transporter un bruit gaussien standard initial, qui ignore la condition, vers la distribution de données conditionnelle. Le modèle doit donc apprendre à la fois le transport de masse et l'injection conditionnelle. Pour réduire la charge imposée au modèle, nous proposons la Reparamétrisation Conditionnelle pour l'Appariement de Flux (CAR-Flow) -- un décalage léger et appris qui conditionne la source, la cible, ou les deux distributions. En repositionnant ces distributions, CAR-Flow raccourcit le chemin de probabilité que le modèle doit apprendre, conduisant à un entraînement plus rapide en pratique. Sur des données synthétiques de faible dimension, nous visualisons et quantifions les effets de CAR. Sur des données d'images naturelles de plus haute dimension (ImageNet-256), l'équipement de SiT-XL/2 avec CAR-Flow réduit le FID de 2,07 à 1,68, tout en introduisant moins de 0,6 % de paramètres supplémentaires.
English
Conditional generative modeling aims to learn a conditional data distribution
from samples containing data-condition pairs. For this, diffusion and
flow-based methods have attained compelling results. These methods use a
learned (flow) model to transport an initial standard Gaussian noise that
ignores the condition to the conditional data distribution. The model is hence
required to learn both mass transport and conditional injection. To ease the
demand on the model, we propose Condition-Aware Reparameterization for Flow
Matching (CAR-Flow) -- a lightweight, learned shift that conditions the source,
the target, or both distributions. By relocating these distributions, CAR-Flow
shortens the probability path the model must learn, leading to faster training
in practice. On low-dimensional synthetic data, we visualize and quantify the
effects of CAR. On higher-dimensional natural image data (ImageNet-256),
equipping SiT-XL/2 with CAR-Flow reduces FID from 2.07 to 1.68, while
introducing less than 0.6% additional parameters.