AlphaFlow: Inzicht in en Verbetering van MeanFlow-modellen
AlphaFlow: Understanding and Improving MeanFlow Models
October 23, 2025
Auteurs: Huijie Zhang, Aliaksandr Siarohin, Willi Menapace, Michael Vasilkovsky, Sergey Tulyakov, Qing Qu, Ivan Skorokhodov
cs.AI
Samenvatting
MeanFlow is recent naar voren gekomen als een krachtig raamwerk voor few-step generatieve modellering die vanaf nul wordt getraind, maar het succes ervan is nog niet volledig begrepen. In dit werk tonen we aan dat de MeanFlow-doelfunctie zich van nature opdeelt in twee delen: trajectstroommatching en trajectconsistentie. Via gradientanalyse stellen we vast dat deze termen sterk negatief gecorreleerd zijn, wat leidt tot optimalisatieconflict en trage convergentie. Gemotiveerd door deze inzichten introduceren we alpha-Flow, een brede familie van doelfuncties die trajectstroommatching, Shortcut Model en MeanFlow verenigt onder één formulering. Door een curriculumstrategie toe te passen die soepel overgaat van trajectstroommatching naar MeanFlow, ontwart alpha-Flow de conflicterende doelen en bereikt het betere convergentie. Wanneer het vanaf nul wordt getraind op klasse-conditionele ImageNet-1K 256x256 met standaard DiT-backbones, presteert alpha-Flow consistent beter dan MeanFlow across schalen en instellingen. Ons grootste alpha-Flow-XL/2+ model behaalt nieuwe state-of-the-art resultaten met standaard DiT-backbones, met FID-scores van 2,58 (1-NFE) en 2,15 (2-NFE).
English
MeanFlow has recently emerged as a powerful framework for few-step generative
modeling trained from scratch, but its success is not yet fully understood. In
this work, we show that the MeanFlow objective naturally decomposes into two
parts: trajectory flow matching and trajectory consistency. Through gradient
analysis, we find that these terms are strongly negatively correlated, causing
optimization conflict and slow convergence. Motivated by these insights, we
introduce alpha-Flow, a broad family of objectives that unifies trajectory
flow matching, Shortcut Model, and MeanFlow under one formulation. By adopting
a curriculum strategy that smoothly anneals from trajectory flow matching to
MeanFlow, alpha-Flow disentangles the conflicting objectives, and achieves
better convergence. When trained from scratch on class-conditional ImageNet-1K
256x256 with vanilla DiT backbones, alpha-Flow consistently outperforms
MeanFlow across scales and settings. Our largest alpha-Flow-XL/2+ model
achieves new state-of-the-art results using vanilla DiT backbones, with FID
scores of 2.58 (1-NFE) and 2.15 (2-NFE).