ChatPaper.aiChatPaper

양자 잡음 제거 확산 모델

Quantum Denoising Diffusion Models

January 13, 2024
저자: Michael Kölle, Gerhard Stenzel, Jonas Stein, Sebastian Zielinski, Björn Ommer, Claudia Linnhoff-Popien
cs.AI

초록

최근 DALL-E, Craiyon, Stable Diffusion와 같은 기계 학습 모델은 간결한 설명으로부터 고해상도 이미지를 생성하는 능력으로 큰 주목을 받고 있다. 동시에, 양자 컴퓨팅은 특히 전통적인 기계 학습 알고리즘의 증가하는 계산 요구를 충족하기 위해 양자 역학을 활용하는 양자 기계 학습 분야에서 유망한 발전을 보이고 있다. 본 논문은 확산 기반 이미지 생성 모델의 효율성을 증대시키기 위해 양자 기계 학습과 변분 양자 회로의 통합을 탐구한다. 구체적으로, 우리는 고전적 확산 모델의 두 가지 주요 문제인 낮은 샘플링 속도와 방대한 매개변수 요구 사항을 해결한다. 우리는 두 가지 양자 확산 모델을 소개하고, 이를 MNIST 숫자, Fashion MNIST, CIFAR-10 데이터셋을 사용하여 고전적 모델과 성능을 비교한다. 우리의 모델은 유사한 매개변수 수준에서 성능 지표인 FID, SSIM, PSNR 측면에서 고전적 모델을 능가한다. 또한, 우리는 확산 과정을 단일 단계로 통합하여 빠른 단일 단계 이미지 생성을 가능하게 하는 일관성 모델 단일 샘플링 아키텍처를 제안한다.
English
In recent years, machine learning models like DALL-E, Craiyon, and Stable Diffusion have gained significant attention for their ability to generate high-resolution images from concise descriptions. Concurrently, quantum computing is showing promising advances, especially with quantum machine learning which capitalizes on quantum mechanics to meet the increasing computational requirements of traditional machine learning algorithms. This paper explores the integration of quantum machine learning and variational quantum circuits to augment the efficacy of diffusion-based image generation models. Specifically, we address two challenges of classical diffusion models: their low sampling speed and the extensive parameter requirements. We introduce two quantum diffusion models and benchmark their capabilities against their classical counterparts using MNIST digits, Fashion MNIST, and CIFAR-10. Our models surpass the classical models with similar parameter counts in terms of performance metrics FID, SSIM, and PSNR. Moreover, we introduce a consistency model unitary single sampling architecture that combines the diffusion procedure into a single step, enabling a fast one-step image generation.
PDF141December 15, 2024