Modelli di Diffusione senza Guida Libera da Classificatore
Diffusion Models without Classifier-free Guidance
February 17, 2025
Autori: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI
Abstract
Questo articolo presenta Model-guidance (MG), un nuovo obiettivo per l'addestramento di modelli di diffusione che affronta e rimuove il comunemente utilizzato Classifier-free guidance (CFG). Il nostro approccio innovativo va oltre la modellazione standard della sola distribuzione dei dati, incorporando la probabilità a posteriori delle condizioni. La tecnica proposta trae origine dall'idea del CFG ed è semplice ma efficace, rendendola un modulo plug-and-play per i modelli esistenti. Il nostro metodo accelera significativamente il processo di addestramento, raddoppia la velocità di inferenza e raggiunge una qualità eccezionale che eguaglia e persino supera i modelli di diffusione concorrenti con CFG. Esperimenti estesi dimostrano l'efficacia, l'efficienza e la scalabilità su diversi modelli e dataset. Infine, stabiliamo prestazioni all'avanguardia sui benchmark di ImageNet 256 con un FID di 1,34. Il nostro codice è disponibile all'indirizzo https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training
diffusion model that addresses and removes of the commonly used Classifier-free
guidance (CFG). Our innovative approach transcends the standard modeling of
solely data distribution to incorporating the posterior probability of
conditions. The proposed technique originates from the idea of CFG and is easy
yet effective, making it a plug-and-play module for existing models. Our method
significantly accelerates the training process, doubles the inference speed,
and achieve exceptional quality that parallel and even surpass concurrent
diffusion models with CFG. Extensive experiments demonstrate the effectiveness,
efficiency, scalability on different models and datasets. Finally, we establish
state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34.
Our code is available at https://github.com/tzco/Diffusion-wo-CFG.