Diffusiebemonstering met momentum voor het verminderen van divergentie-artefacten

Samenvatting

Ondanks het opmerkelijke succes van diffusiemodellen in beeldgeneratie, blijft trage sampling een hardnekkig probleem. Om het samplingproces te versnellen, hebben eerdere studies diffusiesampling herformuleerd als een ODE/SDE en hogere-orde numerieke methoden geïntroduceerd. Deze methoden produceren echter vaak divergentie-artefacten, vooral bij een laag aantal samplingstappen, wat de haalbare versnelling beperkt. In dit artikel onderzoeken we de mogelijke oorzaken van deze artefacten en suggereren we dat de kleine stabiliteitsregio's van deze methoden de belangrijkste oorzaak zouden kunnen zijn. Om dit probleem aan te pakken, stellen we twee nieuwe technieken voor. De eerste techniek omvat de integratie van Heavy Ball (HB)-momentum, een bekende techniek voor het verbeteren van optimalisatie, in bestaande numerieke diffusiemethoden om hun stabiliteitsregio's uit te breiden. We bewijzen ook dat de resulterende methoden convergentie van de eerste orde hebben. De tweede techniek, genaamd Generalized Heavy Ball (GHVB), construeert een nieuwe hogere-orde methode die een variabele afweging biedt tussen nauwkeurigheid en artefactonderdrukking. Experimentele resultaten tonen aan dat onze technieken zeer effectief zijn in het verminderen van artefacten en het verbeteren van beeldkwaliteit, en ze overtreffen state-of-the-art diffusie-oplossers op zowel pixelgebaseerde als latent-gebaseerde diffusiemodellen voor sampling met weinig stappen. Ons onderzoek biedt nieuwe inzichten in het ontwerp van numerieke methoden voor toekomstig diffusiewerk.

English

Despite the remarkable success of diffusion models in image generation, slow sampling remains a persistent issue. To accelerate the sampling process, prior studies have reformulated diffusion sampling as an ODE/SDE and introduced higher-order numerical methods. However, these methods often produce divergence artifacts, especially with a low number of sampling steps, which limits the achievable acceleration. In this paper, we investigate the potential causes of these artifacts and suggest that the small stability regions of these methods could be the principal cause. To address this issue, we propose two novel techniques. The first technique involves the incorporation of Heavy Ball (HB) momentum, a well-known technique for improving optimization, into existing diffusion numerical methods to expand their stability regions. We also prove that the resulting methods have first-order convergence. The second technique, called Generalized Heavy Ball (GHVB), constructs a new high-order method that offers a variable trade-off between accuracy and artifact suppression. Experimental results show that our techniques are highly effective in reducing artifacts and improving image quality, surpassing state-of-the-art diffusion solvers on both pixel-based and latent-based diffusion models for low-step sampling. Our research provides novel insights into the design of numerical methods for future diffusion work.

Diffusiebemonstering met momentum voor het verminderen van divergentie-artefacten

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

Samenvatting

Support