AlphaFlow: Compreendendo e Aprimorando Modelos MeanFlow
AlphaFlow: Understanding and Improving MeanFlow Models
October 23, 2025
Autores: Huijie Zhang, Aliaksandr Siarohin, Willi Menapace, Michael Vasilkovsky, Sergey Tulyakov, Qing Qu, Ivan Skorokhodov
cs.AI
Resumo
O MeanFlow surgiu recentemente como uma estrutura poderosa para modelagem generativa de poucos passos treinada do zero, mas seu sucesso ainda não é totalmente compreendido. Neste trabalho, mostramos que o objetivo do MeanFlow se decompõe naturalmente em duas partes: correspondência de fluxo de trajetória e consistência de trajetória. Através da análise de gradiente, descobrimos que esses termos são fortemente correlacionados negativamente, causando conflito de otimização e convergência lenta. Motivados por essas percepções, introduzimos o alpha-Flow, uma ampla família de objetivos que unifica a correspondência de fluxo de trajetória, o Shortcut Model e o MeanFlow em uma única formulação. Ao adotar uma estratégia de currículo que transita suavemente da correspondência de fluxo de trajetória para o MeanFlow, o alpha-Flow desacopla os objetivos conflitantes e alcança uma melhor convergência. Quando treinado do zero no ImageNet-1K 256x256 condicional por classe com backbones DiT padrão, o alpha-Flow supera consistentemente o MeanFlow em várias escalas e configurações. Nosso maior modelo alpha-Flow-XL/2+ alcança novos resultados state-of-the-art usando backbones DiT padrão, com escores FID de 2,58 (1-NFE) e 2,15 (2-NFE).
English
MeanFlow has recently emerged as a powerful framework for few-step generative
modeling trained from scratch, but its success is not yet fully understood. In
this work, we show that the MeanFlow objective naturally decomposes into two
parts: trajectory flow matching and trajectory consistency. Through gradient
analysis, we find that these terms are strongly negatively correlated, causing
optimization conflict and slow convergence. Motivated by these insights, we
introduce alpha-Flow, a broad family of objectives that unifies trajectory
flow matching, Shortcut Model, and MeanFlow under one formulation. By adopting
a curriculum strategy that smoothly anneals from trajectory flow matching to
MeanFlow, alpha-Flow disentangles the conflicting objectives, and achieves
better convergence. When trained from scratch on class-conditional ImageNet-1K
256x256 with vanilla DiT backbones, alpha-Flow consistently outperforms
MeanFlow across scales and settings. Our largest alpha-Flow-XL/2+ model
achieves new state-of-the-art results using vanilla DiT backbones, with FID
scores of 2.58 (1-NFE) and 2.15 (2-NFE).