AlphaFlow : Comprendre et améliorer les modèles MeanFlow
AlphaFlow: Understanding and Improving MeanFlow Models
October 23, 2025
papers.authors: Huijie Zhang, Aliaksandr Siarohin, Willi Menapace, Michael Vasilkovsky, Sergey Tulyakov, Qing Qu, Ivan Skorokhodov
cs.AI
papers.abstract
MeanFlow a récemment émergé comme un cadre puissant pour la modélisation générative en peu d'étapes entraînée à partir de zéro, mais son succès n'est pas encore entièrement compris. Dans ce travail, nous montrons que l'objectif de MeanFlow se décompose naturellement en deux parties : l'appariement des flux de trajectoire et la cohérence de trajectoire. Par une analyse des gradients, nous constatons que ces termes sont fortement négativement corrélés, provoquant un conflit d'optimisation et une convergence lente. Motivés par ces observations, nous introduisons alpha-Flow, une large famille d'objectifs qui unifie l'appariement des flux de trajectoire, le Shortcut Model et MeanFlow dans une seule formulation. En adoptant une stratégie de curriculum qui passe progressivement de l'appariement des flux de trajectoire à MeanFlow, alpha-Flow désentrelace les objectifs conflictuels et obtient une meilleure convergence. Lorsqu'elle est entraînée à partir de zéro sur ImageNet-1K 256x256 conditionné par classe avec des backbones DiT standard, alpha-Flow surpasse constamment MeanFlow à travers différentes échelles et configurations. Notre plus grand modèle alpha-Flow-XL/2+ établit de nouveaux records en utilisant des backbones DiT standard, avec des scores FID de 2,58 (1-NFE) et 2,15 (2-NFE).
English
MeanFlow has recently emerged as a powerful framework for few-step generative
modeling trained from scratch, but its success is not yet fully understood. In
this work, we show that the MeanFlow objective naturally decomposes into two
parts: trajectory flow matching and trajectory consistency. Through gradient
analysis, we find that these terms are strongly negatively correlated, causing
optimization conflict and slow convergence. Motivated by these insights, we
introduce alpha-Flow, a broad family of objectives that unifies trajectory
flow matching, Shortcut Model, and MeanFlow under one formulation. By adopting
a curriculum strategy that smoothly anneals from trajectory flow matching to
MeanFlow, alpha-Flow disentangles the conflicting objectives, and achieves
better convergence. When trained from scratch on class-conditional ImageNet-1K
256x256 with vanilla DiT backbones, alpha-Flow consistently outperforms
MeanFlow across scales and settings. Our largest alpha-Flow-XL/2+ model
achieves new state-of-the-art results using vanilla DiT backbones, with FID
scores of 2.58 (1-NFE) and 2.15 (2-NFE).