ChatPaper.aiChatPaper

Diffusiemodellen zonder classifier-vrije begeleiding

Diffusion Models without Classifier-free Guidance

February 17, 2025
Auteurs: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI

Samenvatting

Dit artikel introduceert Model-guidance (MG), een nieuw doel voor het trainen van diffusiemodellen dat het veelgebruikte Classifier-free guidance (CFG) aanpakt en vervangt. Onze innovatieve benadering gaat verder dan het standaard modelleren van alleen de dataverdeling door ook de posterior waarschijnlijkheid van condities te integreren. De voorgestelde techniek vindt zijn oorsprong in het idee van CFG en is eenvoudig maar effectief, waardoor het een plug-and-play module wordt voor bestaande modellen. Onze methode versnelt het trainingsproces aanzienlijk, verdubbelt de inferentiesnelheid en bereikt een uitzonderlijke kwaliteit die gelijkwaardig is aan en zelfs overtreft die van gelijktijdige diffusiemodellen met CFG. Uitgebreide experimenten tonen de effectiviteit, efficiëntie en schaalbaarheid aan op verschillende modellen en datasets. Ten slotte behalen we state-of-the-art prestaties op de ImageNet 256 benchmarks met een FID van 1,34. Onze code is beschikbaar op https://github.com/tzco/Diffusion-wo-CFG.
English
This paper presents Model-guidance (MG), a novel objective for training diffusion model that addresses and removes of the commonly used Classifier-free guidance (CFG). Our innovative approach transcends the standard modeling of solely data distribution to incorporating the posterior probability of conditions. The proposed technique originates from the idea of CFG and is easy yet effective, making it a plug-and-play module for existing models. Our method significantly accelerates the training process, doubles the inference speed, and achieve exceptional quality that parallel and even surpass concurrent diffusion models with CFG. Extensive experiments demonstrate the effectiveness, efficiency, scalability on different models and datasets. Finally, we establish state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34. Our code is available at https://github.com/tzco/Diffusion-wo-CFG.

Summary

AI-Generated Summary

PDF72February 19, 2025