ChatPaper.aiChatPaper

Диффузионные модели без использования классификатора без руководства

Diffusion Models without Classifier-free Guidance

February 17, 2025
Авторы: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI

Аннотация

В данной статье представлен Model-guidance (MG) — новый подход к обучению диффузионных моделей, который устраняет необходимость в широко используемом Classifier-free guidance (CFG). Наш инновационный метод выходит за рамки стандартного моделирования только распределения данных, включая в себя апостериорную вероятность условий. Предложенная техника основана на идее CFG, проста в реализации, но эффективна, что делает её модулем plug-and-play для существующих моделей. Наш метод значительно ускоряет процесс обучения, удваивает скорость вывода и достигает исключительного качества, сопоставимого и даже превосходящего современные диффузионные модели с CFG. Многочисленные эксперименты демонстрируют эффективность, производительность и масштабируемость метода на различных моделях и наборах данных. В заключение мы устанавливаем новое состояние искусства на бенчмарке ImageNet 256 с показателем FID, равным 1.34. Наш код доступен по адресу https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training diffusion model that addresses and removes of the commonly used Classifier-free guidance (CFG). Our innovative approach transcends the standard modeling of solely data distribution to incorporating the posterior probability of conditions. The proposed technique originates from the idea of CFG and is easy yet effective, making it a plug-and-play module for existing models. Our method significantly accelerates the training process, doubles the inference speed, and achieve exceptional quality that parallel and even surpass concurrent diffusion models with CFG. Extensive experiments demonstrate the effectiveness, efficiency, scalability on different models and datasets. Finally, we establish state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34. Our code is available at https://github.com/tzco/Diffusion-wo-CFG.

Summary

AI-Generated Summary

PDF72February 19, 2025