AlphaFlow: Comprensión y Mejora de los Modelos MeanFlow
AlphaFlow: Understanding and Improving MeanFlow Models
October 23, 2025
Autores: Huijie Zhang, Aliaksandr Siarohin, Willi Menapace, Michael Vasilkovsky, Sergey Tulyakov, Qing Qu, Ivan Skorokhodov
cs.AI
Resumen
MeanFlow ha surgido recientemente como un marco poderoso para el modelado generativo de pocos pasos entrenado desde cero, pero su éxito aún no se comprende completamente. En este trabajo, demostramos que el objetivo de MeanFlow se descompone naturalmente en dos partes: ajuste de flujo de trayectoria y consistencia de trayectoria. Mediante análisis de gradientes, encontramos que estos términos están fuertemente correlacionados negativamente, causando conflicto de optimización y una convergencia lenta. Motivados por estas observaciones, presentamos alpha-Flow, una amplia familia de objetivos que unifica el ajuste de flujo de trayectoria, Shortcut Model y MeanFlow bajo una misma formulación. Al adoptar una estrategia curricular que transita suavemente desde el ajuste de flujo de trayectoria hasta MeanFlow, alpha-Flow desentrelaza los objetivos en conflicto y logra una mejor convergencia. Cuando se entrena desde cero en ImageNet-1K 256x256 condicionado por clase con backbones DiT estándar, alpha-Flow supera consistentemente a MeanFlow en todas las escalas y configuraciones. Nuestro modelo más grande, alpha-Flow-XL/2+, logra nuevos resultados de vanguardia utilizando backbones DiT estándar, con puntuaciones FID de 2.58 (1-NFE) y 2.15 (2-NFE).
English
MeanFlow has recently emerged as a powerful framework for few-step generative
modeling trained from scratch, but its success is not yet fully understood. In
this work, we show that the MeanFlow objective naturally decomposes into two
parts: trajectory flow matching and trajectory consistency. Through gradient
analysis, we find that these terms are strongly negatively correlated, causing
optimization conflict and slow convergence. Motivated by these insights, we
introduce alpha-Flow, a broad family of objectives that unifies trajectory
flow matching, Shortcut Model, and MeanFlow under one formulation. By adopting
a curriculum strategy that smoothly anneals from trajectory flow matching to
MeanFlow, alpha-Flow disentangles the conflicting objectives, and achieves
better convergence. When trained from scratch on class-conditional ImageNet-1K
256x256 with vanilla DiT backbones, alpha-Flow consistently outperforms
MeanFlow across scales and settings. Our largest alpha-Flow-XL/2+ model
achieves new state-of-the-art results using vanilla DiT backbones, with FID
scores of 2.58 (1-NFE) and 2.15 (2-NFE).