Modelos de Difusão de Desruído Quântico
Quantum Denoising Diffusion Models
January 13, 2024
Autores: Michael Kölle, Gerhard Stenzel, Jonas Stein, Sebastian Zielinski, Björn Ommer, Claudia Linnhoff-Popien
cs.AI
Resumo
Nos últimos anos, modelos de aprendizado de máquina como DALL-E, Craiyon e Stable Diffusion ganharam atenção significativa por sua capacidade de gerar imagens de alta resolução a partir de descrições concisas. Paralelamente, a computação quântica tem mostrado avanços promissores, especialmente com o aprendizado de máquina quântico, que aproveita a mecânica quântica para atender às crescentes demandas computacionais dos algoritmos tradicionais de aprendizado de máquina. Este artigo explora a integração do aprendizado de máquina quântico e circuitos quânticos variacionais para aumentar a eficácia dos modelos de geração de imagens baseados em difusão. Especificamente, abordamos dois desafios dos modelos clássicos de difusão: sua baixa velocidade de amostragem e os extensos requisitos de parâmetros. Introduzimos dois modelos quânticos de difusão e avaliamos suas capacidades em comparação com suas contrapartes clássicas usando dígitos MNIST, Fashion MNIST e CIFAR-10. Nossos modelos superam os modelos clássicos com contagens de parâmetros semelhantes em termos das métricas de desempenho FID, SSIM e PSNR. Além disso, introduzimos uma arquitetura de amostragem única unitária de modelo de consistência que combina o procedimento de difusão em uma única etapa, permitindo uma geração rápida de imagens em um único passo.
English
In recent years, machine learning models like DALL-E, Craiyon, and Stable
Diffusion have gained significant attention for their ability to generate
high-resolution images from concise descriptions. Concurrently, quantum
computing is showing promising advances, especially with quantum machine
learning which capitalizes on quantum mechanics to meet the increasing
computational requirements of traditional machine learning algorithms. This
paper explores the integration of quantum machine learning and variational
quantum circuits to augment the efficacy of diffusion-based image generation
models. Specifically, we address two challenges of classical diffusion models:
their low sampling speed and the extensive parameter requirements. We introduce
two quantum diffusion models and benchmark their capabilities against their
classical counterparts using MNIST digits, Fashion MNIST, and CIFAR-10. Our
models surpass the classical models with similar parameter counts in terms of
performance metrics FID, SSIM, and PSNR. Moreover, we introduce a consistency
model unitary single sampling architecture that combines the diffusion
procedure into a single step, enabling a fast one-step image generation.