Kwantum Denoising Diffusiemodellen
Quantum Denoising Diffusion Models
January 13, 2024
Auteurs: Michael Kölle, Gerhard Stenzel, Jonas Stein, Sebastian Zielinski, Björn Ommer, Claudia Linnhoff-Popien
cs.AI
Samenvatting
De afgelopen jaren hebben machine learning-modellen zoals DALL-E, Craiyon en Stable Diffusion aanzienlijke aandacht gekregen vanwege hun vermogen om hoogwaardige afbeeldingen te genereren op basis van beknopte beschrijvingen. Tegelijkertijd laten quantumcomputing veelbelovende ontwikkelingen zien, met name op het gebied van quantum machine learning, dat gebruikmaakt van quantummechanica om te voldoen aan de toenemende rekenvereisten van traditionele machine learning-algoritmen. Dit artikel onderzoekt de integratie van quantum machine learning en variatie-quantumcircuits om de effectiviteit van diffusiegebaseerde afbeeldingsgeneratiemodellen te vergroten. Specifiek gaan we in op twee uitdagingen van klassieke diffusiemodellen: hun lage sampling snelheid en de uitgebreide parametervereisten. We introduceren twee quantumdiffusiemodellen en vergelijken hun prestaties met die van hun klassieke tegenhangers aan de hand van MNIST-cijfers, Fashion MNIST en CIFAR-10. Onze modellen overtreffen de klassieke modellen met een vergelijkbaar aantal parameters wat betreft de prestatiemetingen FID, SSIM en PSNR. Bovendien introduceren we een consistentiemodel met een unitaire single sampling-architectuur die het diffusieproces combineert in één stap, waardoor een snelle één-staps afbeeldingsgeneratie mogelijk wordt.
English
In recent years, machine learning models like DALL-E, Craiyon, and Stable
Diffusion have gained significant attention for their ability to generate
high-resolution images from concise descriptions. Concurrently, quantum
computing is showing promising advances, especially with quantum machine
learning which capitalizes on quantum mechanics to meet the increasing
computational requirements of traditional machine learning algorithms. This
paper explores the integration of quantum machine learning and variational
quantum circuits to augment the efficacy of diffusion-based image generation
models. Specifically, we address two challenges of classical diffusion models:
their low sampling speed and the extensive parameter requirements. We introduce
two quantum diffusion models and benchmark their capabilities against their
classical counterparts using MNIST digits, Fashion MNIST, and CIFAR-10. Our
models surpass the classical models with similar parameter counts in terms of
performance metrics FID, SSIM, and PSNR. Moreover, we introduce a consistency
model unitary single sampling architecture that combines the diffusion
procedure into a single step, enabling a fast one-step image generation.