ChatPaper.aiChatPaper

Muestreo de Difusión con Momento para Mitigar Artefactos de Divergencia

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

July 20, 2023
Autores: Suttisak Wizadwongsa, Worameth Chinchuthakun, Pramook Khungurn, Amit Raj, Supasorn Suwajanakorn
cs.AI

Resumen

A pesar del notable éxito de los modelos de difusión en la generación de imágenes, el muestreo lento sigue siendo un problema persistente. Para acelerar el proceso de muestreo, estudios previos han reformulado el muestreo de difusión como una EDO/EDE e introducido métodos numéricos de orden superior. Sin embargo, estos métodos a menudo producen artefactos de divergencia, especialmente con un número reducido de pasos de muestreo, lo que limita la aceleración alcanzable. En este artículo, investigamos las posibles causas de estos artefactos y sugerimos que las pequeñas regiones de estabilidad de estos métodos podrían ser la causa principal. Para abordar este problema, proponemos dos técnicas novedosas. La primera técnica implica la incorporación del momento Heavy Ball (HB), una técnica conocida para mejorar la optimización, en los métodos numéricos de difusión existentes para ampliar sus regiones de estabilidad. También demostramos que los métodos resultantes tienen convergencia de primer orden. La segunda técnica, llamada Heavy Ball Generalizado (GHVB), construye un nuevo método de alto orden que ofrece un equilibrio variable entre precisión y supresión de artefactos. Los resultados experimentales muestran que nuestras técnicas son altamente efectivas para reducir artefactos y mejorar la calidad de la imagen, superando a los solucionadores de difusión más avanzados tanto en modelos de difusión basados en píxeles como en modelos basados en latentes para muestreo con pocos pasos. Nuestra investigación proporciona nuevas perspectivas en el diseño de métodos numéricos para futuros trabajos en difusión.
English
Despite the remarkable success of diffusion models in image generation, slow sampling remains a persistent issue. To accelerate the sampling process, prior studies have reformulated diffusion sampling as an ODE/SDE and introduced higher-order numerical methods. However, these methods often produce divergence artifacts, especially with a low number of sampling steps, which limits the achievable acceleration. In this paper, we investigate the potential causes of these artifacts and suggest that the small stability regions of these methods could be the principal cause. To address this issue, we propose two novel techniques. The first technique involves the incorporation of Heavy Ball (HB) momentum, a well-known technique for improving optimization, into existing diffusion numerical methods to expand their stability regions. We also prove that the resulting methods have first-order convergence. The second technique, called Generalized Heavy Ball (GHVB), constructs a new high-order method that offers a variable trade-off between accuracy and artifact suppression. Experimental results show that our techniques are highly effective in reducing artifacts and improving image quality, surpassing state-of-the-art diffusion solvers on both pixel-based and latent-based diffusion models for low-step sampling. Our research provides novel insights into the design of numerical methods for future diffusion work.
PDF80December 15, 2024