Modelos de Difusión sin Guía Libre de Clasificador
Diffusion Models without Classifier-free Guidance
February 17, 2025
Autores: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI
Resumen
Este artículo presenta Model-guidance (MG), un objetivo novedoso para entrenar modelos de difusión que aborda y elimina el uso común de Classifier-free guidance (CFG). Nuestro enfoque innovador trasciende el modelado estándar de la distribución de datos para incorporar la probabilidad posterior de las condiciones. La técnica propuesta se origina a partir de la idea de CFG y es simple pero efectiva, convirtiéndola en un módulo plug-and-play para modelos existentes. Nuestro método acelera significativamente el proceso de entrenamiento, duplica la velocidad de inferencia y logra una calidad excepcional que iguala e incluso supera a los modelos de difusión concurrentes con CFG. Experimentos exhaustivos demuestran la efectividad, eficiencia y escalabilidad en diferentes modelos y conjuntos de datos. Finalmente, establecemos un rendimiento de vanguardia en los benchmarks de ImageNet 256 con un FID de 1.34. Nuestro código está disponible en https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training
diffusion model that addresses and removes of the commonly used Classifier-free
guidance (CFG). Our innovative approach transcends the standard modeling of
solely data distribution to incorporating the posterior probability of
conditions. The proposed technique originates from the idea of CFG and is easy
yet effective, making it a plug-and-play module for existing models. Our method
significantly accelerates the training process, doubles the inference speed,
and achieve exceptional quality that parallel and even surpass concurrent
diffusion models with CFG. Extensive experiments demonstrate the effectiveness,
efficiency, scalability on different models and datasets. Finally, we establish
state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34.
Our code is available at https://github.com/tzco/Diffusion-wo-CFG.Summary
AI-Generated Summary