ChatPaper.aiChatPaper

Modelos de Difusión sin Guía Libre de Clasificador

Diffusion Models without Classifier-free Guidance

February 17, 2025
Autores: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI

Resumen

Este artículo presenta Model-guidance (MG), un objetivo novedoso para entrenar modelos de difusión que aborda y elimina el uso común de Classifier-free guidance (CFG). Nuestro enfoque innovador trasciende el modelado estándar de la distribución de datos para incorporar la probabilidad posterior de las condiciones. La técnica propuesta se origina a partir de la idea de CFG y es simple pero efectiva, convirtiéndola en un módulo plug-and-play para modelos existentes. Nuestro método acelera significativamente el proceso de entrenamiento, duplica la velocidad de inferencia y logra una calidad excepcional que iguala e incluso supera a los modelos de difusión concurrentes con CFG. Experimentos exhaustivos demuestran la efectividad, eficiencia y escalabilidad en diferentes modelos y conjuntos de datos. Finalmente, establecemos un rendimiento de vanguardia en los benchmarks de ImageNet 256 con un FID de 1.34. Nuestro código está disponible en https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training diffusion model that addresses and removes of the commonly used Classifier-free guidance (CFG). Our innovative approach transcends the standard modeling of solely data distribution to incorporating the posterior probability of conditions. The proposed technique originates from the idea of CFG and is easy yet effective, making it a plug-and-play module for existing models. Our method significantly accelerates the training process, doubles the inference speed, and achieve exceptional quality that parallel and even surpass concurrent diffusion models with CFG. Extensive experiments demonstrate the effectiveness, efficiency, scalability on different models and datasets. Finally, we establish state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34. Our code is available at https://github.com/tzco/Diffusion-wo-CFG.

Summary

AI-Generated Summary

PDF72February 19, 2025