AlphaFlow: Verständnis und Verbesserung von MeanFlow-Modellen
AlphaFlow: Understanding and Improving MeanFlow Models
October 23, 2025
papers.authors: Huijie Zhang, Aliaksandr Siarohin, Willi Menapace, Michael Vasilkovsky, Sergey Tulyakov, Qing Qu, Ivan Skorokhodov
cs.AI
papers.abstract
MeanFlow hat sich kürzlich als leistungsstarkes Framework für Few-Step-Generativmodellierung aus dem Nichts erwiesen, doch sein Erfolg ist noch nicht vollständig verstanden. In dieser Arbeit zeigen wir, dass sich das MeanFlow-Ziel natürlich in zwei Teile zerlegt: Trajektorien-Flow-Matching und Trajektorien-Konsistenz. Durch Gradientenanalyse stellen wir fest, dass diese Terme stark negativ korreliert sind, was zu Optimierungskonflikten und langsamer Konvergenz führt. Aufbauend auf diesen Erkenntnissen führen wir alpha-Flow ein, eine breite Familie von Zielen, die Trajektorien-Flow-Matching, Shortcut Model und MeanFlow in einer Formel vereint. Durch die Anwendung einer Curriculum-Strategie, die sanft von Trajektorien-Flow-Matching zu MeanFlow übergeht, entwirrt alpha-Flow die konfligierenden Ziele und erreicht eine bessere Konvergenz. Bei Training aus dem Nichts auf klassekonditionalem ImageNet-1K 256x256 mit reinen DiT-Backbones übertrifft alpha-Flow MeanFlow konsistent über verschiedene Skalen und Einstellungen hinweg. Unser größtes alpha-Flow-XL/2+-Modell erzielt mit reinen DiT-Backbones neue State-of-the-Art-Ergebnisse mit FID-Werten von 2,58 (1-NFE) und 2,15 (2-NFE).
English
MeanFlow has recently emerged as a powerful framework for few-step generative
modeling trained from scratch, but its success is not yet fully understood. In
this work, we show that the MeanFlow objective naturally decomposes into two
parts: trajectory flow matching and trajectory consistency. Through gradient
analysis, we find that these terms are strongly negatively correlated, causing
optimization conflict and slow convergence. Motivated by these insights, we
introduce alpha-Flow, a broad family of objectives that unifies trajectory
flow matching, Shortcut Model, and MeanFlow under one formulation. By adopting
a curriculum strategy that smoothly anneals from trajectory flow matching to
MeanFlow, alpha-Flow disentangles the conflicting objectives, and achieves
better convergence. When trained from scratch on class-conditional ImageNet-1K
256x256 with vanilla DiT backbones, alpha-Flow consistently outperforms
MeanFlow across scales and settings. Our largest alpha-Flow-XL/2+ model
achieves new state-of-the-art results using vanilla DiT backbones, with FID
scores of 2.58 (1-NFE) and 2.15 (2-NFE).