ChatPaper.aiChatPaper

Diffusion-Sampling mit Impuls zur Minderung von Divergenzartefakten

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

July 20, 2023
Autoren: Suttisak Wizadwongsa, Worameth Chinchuthakun, Pramook Khungurn, Amit Raj, Supasorn Suwajanakorn
cs.AI

Zusammenfassung

Trotz des bemerkenswerten Erfolgs von Diffusionsmodellen in der Bildgenerierung bleibt die langsame Abtastung ein anhaltendes Problem. Um den Abtastprozess zu beschleunigen, haben frühere Studien die Diffusionsabtastung als ODE/SDE neu formuliert und numerische Methoden höherer Ordnung eingeführt. Diese Methoden erzeugen jedoch oft Divergenzartefakte, insbesondere bei einer geringen Anzahl von Abtastschritten, was die erreichbare Beschleunigung begrenzt. In dieser Arbeit untersuchen wir die potenziellen Ursachen dieser Artefakte und vermuten, dass die kleinen Stabilitätsbereiche dieser Methoden die Hauptursache sein könnten. Um dieses Problem zu lösen, schlagen wir zwei neuartige Techniken vor. Die erste Technik beinhaltet die Einbindung von Heavy Ball (HB)-Impuls, einer bekannten Technik zur Verbesserung der Optimierung, in bestehende numerische Diffusionsmethoden, um deren Stabilitätsbereiche zu erweitern. Wir beweisen auch, dass die resultierenden Methoden eine Konvergenz erster Ordnung aufweisen. Die zweite Technik, genannt Generalized Heavy Ball (GHVB), konstruiert eine neue Methode höherer Ordnung, die einen variablen Kompromiss zwischen Genauigkeit und Artefaktunterdrückung bietet. Experimentelle Ergebnisse zeigen, dass unsere Techniken sehr effektiv darin sind, Artefakte zu reduzieren und die Bildqualität zu verbessern, und dabei state-of-the-art Diffusionslöser sowohl bei pixelbasierten als auch latentbasierten Diffusionsmodellen für die Abtastung mit wenigen Schritten übertreffen. Unsere Forschung bietet neue Einblicke in die Gestaltung numerischer Methoden für zukünftige Diffusionsarbeiten.
English
Despite the remarkable success of diffusion models in image generation, slow sampling remains a persistent issue. To accelerate the sampling process, prior studies have reformulated diffusion sampling as an ODE/SDE and introduced higher-order numerical methods. However, these methods often produce divergence artifacts, especially with a low number of sampling steps, which limits the achievable acceleration. In this paper, we investigate the potential causes of these artifacts and suggest that the small stability regions of these methods could be the principal cause. To address this issue, we propose two novel techniques. The first technique involves the incorporation of Heavy Ball (HB) momentum, a well-known technique for improving optimization, into existing diffusion numerical methods to expand their stability regions. We also prove that the resulting methods have first-order convergence. The second technique, called Generalized Heavy Ball (GHVB), constructs a new high-order method that offers a variable trade-off between accuracy and artifact suppression. Experimental results show that our techniques are highly effective in reducing artifacts and improving image quality, surpassing state-of-the-art diffusion solvers on both pixel-based and latent-based diffusion models for low-step sampling. Our research provides novel insights into the design of numerical methods for future diffusion work.
PDF80December 15, 2024