ChatPaper.aiChatPaper

分類器不要のガイダンスを伴わない拡散モデル

Diffusion Models without Classifier-free Guidance

February 17, 2025
著者: Zhicong Tang, Jianmin Bao, Dong Chen, Baining Guo
cs.AI

要旨

本論文では、拡散モデルの訓練における新たな目的関数であるModel-guidance(MG)を提案し、広く用いられているClassifier-free guidance(CFG)の問題点を解決し、その使用を不要とします。我々の革新的なアプローチは、単なるデータ分布のモデリングを超えて、条件付き事後確率を組み込むものです。提案手法はCFGの概念に由来し、簡潔でありながら効果的で、既存のモデルにプラグアンドプレイ可能なモジュールとなっています。本手法は訓練プロセスを大幅に加速し、推論速度を2倍に向上させ、CFGを用いた同時期の拡散モデルと同等かそれ以上の品質を実現します。様々なモデルとデータセットを用いた広範な実験により、その有効性、効率性、拡張性が実証されました。最後に、ImageNet 256ベンチマークにおいてFIDスコア1.34を達成し、最先端の性能を確立しました。コードはhttps://github.com/tzco/Diffusion-wo-CFGで公開されています。
English
This paper presents Model-guidance (MG), a novel objective for training diffusion model that addresses and removes of the commonly used Classifier-free guidance (CFG). Our innovative approach transcends the standard modeling of solely data distribution to incorporating the posterior probability of conditions. The proposed technique originates from the idea of CFG and is easy yet effective, making it a plug-and-play module for existing models. Our method significantly accelerates the training process, doubles the inference speed, and achieve exceptional quality that parallel and even surpass concurrent diffusion models with CFG. Extensive experiments demonstrate the effectiveness, efficiency, scalability on different models and datasets. Finally, we establish state-of-the-art performance on ImageNet 256 benchmarks with an FID of 1.34. Our code is available at https://github.com/tzco/Diffusion-wo-CFG.
PDF72February 19, 2025