ChatPaper.aiChatPaper

Voorbij U: Snellere en Lichtere Diffusiemodellen

Beyond U: Making Diffusion Models Faster & Lighter

October 31, 2023
Auteurs: Sergio Calvo-Ordonez, Jiahao Huang, Lipei Zhang, Guang Yang, Carola-Bibiane Schonlieb, Angelica I Aviles-Rivero
cs.AI

Samenvatting

Diffusiemodellen vormen een familie van generatieve modellen die baanbrekende prestaties leveren in taken zoals beeldgeneratie, videoproductie en molecuulontwerp. Ondanks hun mogelijkheden blijft hun efficiëntie, met name in het omgekeerde denoisingsproces, een uitdaging vanwege trage convergentiesnelheden en hoge rekenkosten. In dit werk introduceren we een aanpak die gebruikmaakt van continue dynamische systemen om een nieuw denoisingnetwerk voor diffusiemodellen te ontwerpen dat parameter-efficiënter is, sneller convergeert en een verhoogde ruisbestendigheid vertoont. Door te experimenteren met denoising probabilistische diffusiemodellen, werkt ons framework met ongeveer een kwart van de parameters en 30% van de Floating Point Operations (FLOPs) vergeleken met standaard U-Nets in Denoising Diffusion Probabilistic Models (DDPMs). Bovendien is ons model tot 70% sneller in inferentie dan de baseline-modellen onder gelijke omstandigheden, terwijl het convergeert naar oplossingen van betere kwaliteit.
English
Diffusion models are a family of generative models that yield record-breaking performance in tasks such as image synthesis, video generation, and molecule design. Despite their capabilities, their efficiency, especially in the reverse denoising process, remains a challenge due to slow convergence rates and high computational costs. In this work, we introduce an approach that leverages continuous dynamical systems to design a novel denoising network for diffusion models that is more parameter-efficient, exhibits faster convergence, and demonstrates increased noise robustness. Experimenting with denoising probabilistic diffusion models, our framework operates with approximately a quarter of the parameters and 30% of the Floating Point Operations (FLOPs) compared to standard U-Nets in Denoising Diffusion Probabilistic Models (DDPMs). Furthermore, our model is up to 70% faster in inference than the baseline models when measured in equal conditions while converging to better quality solutions.
PDF121February 7, 2026