ChatPaper.aiChatPaper

Afstotende Score Distillatie voor Diverse Steekproeven van Diffusiemodellen

Repulsive Score Distillation for Diverse Sampling of Diffusion Models

June 24, 2024
Auteurs: Nicolas Zilberstein, Morteza Mardani, Santiago Segarra
cs.AI

Samenvatting

Score distillation sampling is van cruciaal belang geweest voor het integreren van diffusiemodellen in de generatie van complexe visuals. Ondanks indrukwekkende resultaten lijdt het aan mode collapse en een gebrek aan diversiteit. Om deze uitdaging het hoofd te bieden, maken we gebruik van de gradient flow interpretatie van score distillation om Repulsive Score Distillation (RSD) voor te stellen. In het bijzonder stellen we een variatieraamwerk voor dat gebaseerd is op de afstoting van een ensemble van deeltjes, wat diversiteit bevordert. Door een variatiebenadering te gebruiken die een koppeling tussen deeltjes incorporeert, verschijnt de afstoting als een eenvoudige regularisatie die interactie tussen deeltjes mogelijk maakt op basis van hun relatieve paarsgewijze gelijkenis, gemeten bijvoorbeeld via radiale basisfuncties. We ontwerpen RSD voor zowel onbeperkte als beperkte sampling scenario's. Voor beperkte sampling richten we ons op inverse problemen in de latente ruimte, wat leidt tot een uitgebreide variatieformulering die een goede balans vindt tussen rekenkracht, kwaliteit en diversiteit. Onze uitgebreide experimenten voor tekst-naar-beeldgeneratie en inverse problemen tonen aan dat RSD een superieure balans bereikt tussen diversiteit en kwaliteit in vergelijking met state-of-the-art alternatieven.
English
Score distillation sampling has been pivotal for integrating diffusion models into generation of complex visuals. Despite impressive results it suffers from mode collapse and lack of diversity. To cope with this challenge, we leverage the gradient flow interpretation of score distillation to propose Repulsive Score Distillation (RSD). In particular, we propose a variational framework based on repulsion of an ensemble of particles that promotes diversity. Using a variational approximation that incorporates a coupling among particles, the repulsion appears as a simple regularization that allows interaction of particles based on their relative pairwise similarity, measured e.g., via radial basis kernels. We design RSD for both unconstrained and constrained sampling scenarios. For constrained sampling we focus on inverse problems in the latent space that leads to an augmented variational formulation, that strikes a good balance between compute, quality and diversity. Our extensive experiments for text-to-image generation, and inverse problems demonstrate that RSD achieves a superior trade-off between diversity and quality compared with state-of-the-art alternatives.
PDF42February 8, 2026