Diffusiemodellen zonder classifier-vrije begeleiding
Diffusion Models without Classifier-free Guidance
February 17, 2025
Auteurs: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI
Samenvatting
Dit artikel introduceert Model-guidance (MG), een nieuw doel voor het trainen van diffusiemodellen dat het veelgebruikte Classifier-free guidance (CFG) aanpakt en vervangt. Onze innovatieve benadering gaat verder dan het standaard modelleren van alleen de dataverdeling door ook de posterior waarschijnlijkheid van condities te integreren. De voorgestelde techniek vindt zijn oorsprong in het idee van CFG en is eenvoudig maar effectief, waardoor het een plug-and-play module wordt voor bestaande modellen. Onze methode versnelt het trainingsproces aanzienlijk, verdubbelt de inferentiesnelheid en bereikt een uitzonderlijke kwaliteit die gelijkwaardig is aan en zelfs overtreft die van gelijktijdige diffusiemodellen met CFG. Uitgebreide experimenten tonen de effectiviteit, efficiëntie en schaalbaarheid aan op verschillende modellen en datasets. Ten slotte behalen we state-of-the-art prestaties op de ImageNet 256 benchmarks met een FID van 1,34. Onze code is beschikbaar op https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training
diffusion model that addresses and removes of the commonly used Classifier-free
guidance (CFG). Our innovative approach transcends the standard modeling of
solely data distribution to incorporating the posterior probability of
conditions. The proposed technique originates from the idea of CFG and is easy
yet effective, making it a plug-and-play module for existing models. Our method
significantly accelerates the training process, doubles the inference speed,
and achieve exceptional quality that parallel and even surpass concurrent
diffusion models with CFG. Extensive experiments demonstrate the effectiveness,
efficiency, scalability on different models and datasets. Finally, we establish
state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34.
Our code is available at https://github.com/tzco/Diffusion-wo-CFG.Summary
AI-Generated Summary