ChatPaper.aiChatPaper

Диффузионная выборка с использованием импульса для смягчения артефактов расхождения

Diffusion Sampling with Momentum for Mitigating Divergence Artifacts

July 20, 2023
Авторы: Suttisak Wizadwongsa, Worameth Chinchuthakun, Pramook Khungurn, Amit Raj, Supasorn Suwajanakorn
cs.AI

Аннотация

Несмотря на впечатляющие успехи диффузионных моделей в генерации изображений, проблема медленного сэмплинга остается актуальной. Для ускорения процесса сэмплинга предыдущие исследования переформулировали диффузионный сэмплинг как обыкновенное дифференциальное уравнение (ОДУ) или стохастическое дифференциальное уравнение (СДУ) и предложили численные методы более высокого порядка. Однако эти методы часто приводят к появлению артефактов расходимости, особенно при малом количестве шагов сэмплинга, что ограничивает возможное ускорение. В данной работе мы исследуем потенциальные причины этих артефактов и предполагаем, что основной причиной могут быть малые области устойчивости этих методов. Для решения этой проблемы мы предлагаем два новых подхода. Первый подход заключается во внедрении импульса Heavy Ball (HB), известного метода для улучшения оптимизации, в существующие численные методы диффузии с целью расширения их областей устойчивости. Мы также доказываем, что полученные методы обладают сходимостью первого порядка. Второй подход, называемый Generalized Heavy Ball (GHVB), создает новый метод высокого порядка, который предлагает переменный компромисс между точностью и подавлением артефактов. Экспериментальные результаты показывают, что наши методы эффективно снижают артефакты и улучшают качество изображений, превосходя современные диффузионные решатели как для пиксельных, так и для латентных диффузионных моделей при сэмплинге с малым числом шагов. Наше исследование предоставляет новые идеи для разработки численных методов в будущих работах по диффузии.
English
Despite the remarkable success of diffusion models in image generation, slow sampling remains a persistent issue. To accelerate the sampling process, prior studies have reformulated diffusion sampling as an ODE/SDE and introduced higher-order numerical methods. However, these methods often produce divergence artifacts, especially with a low number of sampling steps, which limits the achievable acceleration. In this paper, we investigate the potential causes of these artifacts and suggest that the small stability regions of these methods could be the principal cause. To address this issue, we propose two novel techniques. The first technique involves the incorporation of Heavy Ball (HB) momentum, a well-known technique for improving optimization, into existing diffusion numerical methods to expand their stability regions. We also prove that the resulting methods have first-order convergence. The second technique, called Generalized Heavy Ball (GHVB), constructs a new high-order method that offers a variable trade-off between accuracy and artifact suppression. Experimental results show that our techniques are highly effective in reducing artifacts and improving image quality, surpassing state-of-the-art diffusion solvers on both pixel-based and latent-based diffusion models for low-step sampling. Our research provides novel insights into the design of numerical methods for future diffusion work.
PDF80December 15, 2024