CAR-Flow: Condition-Aware Herparameterisatie Brengt Bron en Doel in Lijn voor Betere Flow Matching
CAR-Flow: Condition-Aware Reparameterization Aligns Source and Target for Better Flow Matching
September 23, 2025
Auteurs: Chen Chen, Pengsheng Guo, Liangchen Song, Jiasen Lu, Rui Qian, Xinze Wang, Tsu-Jui Fu, Wei Liu, Yinfei Yang, Alex Schwing
cs.AI
Samenvatting
Conditionele generatieve modellering heeft als doel een conditionele dataverdeling te leren
van steekproeven die data-voorwaarde-paren bevatten. Hiervoor hebben diffusie- en
stroomgebaseerde methoden overtuigende resultaten behaald. Deze methoden gebruiken een
geleerd (stroom)model om een initiële standaard Gaussische ruis die de voorwaarde negeert,
te transporteren naar de conditionele dataverdeling. Het model moet dus zowel
massatransport als conditionele injectie leren. Om de eisen aan het model te verlichten,
stellen we Condition-Aware Reparameterization for Flow Matching (CAR-Flow) voor --
een lichtgewicht, geleerde verschuiving die de bron-, de doel-, of beide verdelingen
conditioneert. Door deze verdelingen te verplaatsen, verkort CAR-Flow het waarschijnlijkheidspad
dat het model moet leren, wat in de praktijk tot snellere training leidt. Op laagdimensionale
synthetische data visualiseren en kwantificeren we de effecten van CAR. Op hogerdimensionale
natuurlijke beelddata (ImageNet-256) reduceert het uitrusten van SiT-XL/2 met CAR-Flow de FID
van 2.07 naar 1.68, terwijl er minder dan 0.6% extra parameters worden geïntroduceerd.
English
Conditional generative modeling aims to learn a conditional data distribution
from samples containing data-condition pairs. For this, diffusion and
flow-based methods have attained compelling results. These methods use a
learned (flow) model to transport an initial standard Gaussian noise that
ignores the condition to the conditional data distribution. The model is hence
required to learn both mass transport and conditional injection. To ease the
demand on the model, we propose Condition-Aware Reparameterization for Flow
Matching (CAR-Flow) -- a lightweight, learned shift that conditions the source,
the target, or both distributions. By relocating these distributions, CAR-Flow
shortens the probability path the model must learn, leading to faster training
in practice. On low-dimensional synthetic data, we visualize and quantify the
effects of CAR. On higher-dimensional natural image data (ImageNet-256),
equipping SiT-XL/2 with CAR-Flow reduces FID from 2.07 to 1.68, while
introducing less than 0.6% additional parameters.