ChatPaper.aiChatPaper

発散アーティファクトを軽減するためのモーメンタムを用いた拡散サンプリング

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

July 20, 2023
著者: Suttisak Wizadwongsa, Worameth Chinchuthakun, Pramook Khungurn, Amit Raj, Supasorn Suwajanakorn
cs.AI

要旨

拡散モデルの画像生成における顕著な成功にもかかわらず、サンプリングの遅さは依然として解決すべき課題です。サンプリングプロセスを加速するため、これまでの研究では拡散サンプリングをODE/SDEとして再定式化し、高次の数値解法を導入してきました。しかし、これらの手法は特にサンプリングステップ数が少ない場合に発散アーティファクトを生じやすく、達成可能な加速に制限をかけています。本論文では、これらのアーティファクトの潜在的な原因を調査し、これらの手法の安定領域が小さいことが主な原因である可能性を示唆します。この問題に対処するため、我々は2つの新しい技術を提案します。第一の技術は、最適化の改善に有効な手法として知られるHeavy Ball(HB)モーメンタムを既存の拡散数値解法に組み込み、その安定領域を拡大するものです。また、結果として得られる手法が一次収束することを証明します。第二の技術はGeneralized Heavy Ball(GHVB)と呼ばれ、精度とアーティファクト抑制の間の可変的なトレードオフを提供する新しい高次手法を構築します。実験結果は、我々の技術がアーティファクトの削減と画質の向上に極めて有効であり、ピクセルベースおよび潜在ベースの拡散モデルにおける低ステップサンプリングにおいて、最先端の拡散ソルバーを凌駕することを示しています。本研究は、将来の拡散研究における数値解法の設計に新たな洞察を提供します。
English
Despite the remarkable success of diffusion models in image generation, slow sampling remains a persistent issue. To accelerate the sampling process, prior studies have reformulated diffusion sampling as an ODE/SDE and introduced higher-order numerical methods. However, these methods often produce divergence artifacts, especially with a low number of sampling steps, which limits the achievable acceleration. In this paper, we investigate the potential causes of these artifacts and suggest that the small stability regions of these methods could be the principal cause. To address this issue, we propose two novel techniques. The first technique involves the incorporation of Heavy Ball (HB) momentum, a well-known technique for improving optimization, into existing diffusion numerical methods to expand their stability regions. We also prove that the resulting methods have first-order convergence. The second technique, called Generalized Heavy Ball (GHVB), constructs a new high-order method that offers a variable trade-off between accuracy and artifact suppression. Experimental results show that our techniques are highly effective in reducing artifacts and improving image quality, surpassing state-of-the-art diffusion solvers on both pixel-based and latent-based diffusion models for low-step sampling. Our research provides novel insights into the design of numerical methods for future diffusion work.
PDF80December 15, 2024