ChatPaper.aiChatPaper

Geen training, geen probleem: Een nieuwe kijk op classifier-vrije begeleiding voor diffusiemodellen

No Training, No Problem: Rethinking Classifier-Free Guidance for Diffusion Models

July 2, 2024
Auteurs: Seyedmorteza Sadat, Manuel Kansy, Otmar Hilliges, Romann M. Weber
cs.AI

Samenvatting

Classifier-free guidance (CFG) is de standaardmethode geworden om de kwaliteit van conditionele diffusiemodellen te verbeteren. Het gebruik van CFG vereist echter ofwel het trainen van een onvoorwaardelijk model naast het hoofd-diffusiemodel, ofwel het aanpassen van het trainingsproces door periodiek een nulconditie in te voegen. Er is ook geen duidelijke uitbreiding van CFG naar onvoorwaardelijke modellen. In dit artikel herzien we de kernprincipes van CFG en introduceren we een nieuwe methode, independent condition guidance (ICG), die de voordelen van CFG biedt zonder dat er speciale trainingsprocedures nodig zijn. Onze aanpak vereenvoudigt het trainingsproces van conditionele diffusiemodellen en kan ook worden toegepast tijdens inferentie op elk vooraf getraind conditioneel model. Daarnaast stellen we, door gebruik te maken van de tijdstapinformatie die in alle diffusienetwerken is gecodeerd, een uitbreiding van CFG voor, genaamd time-step guidance (TSG), die kan worden toegepast op elk diffusiemodel, inclusief onvoorwaardelijke modellen. Onze begeleidingstechnieken zijn eenvoudig te implementeren en hebben dezelfde steekproefkosten als CFG. Door middel van uitgebreide experimenten tonen we aan dat ICG de prestaties van standaard CFG evenaart bij verschillende conditionele diffusiemodellen. Bovendien laten we zien dat TSG de generatiekwaliteit op een vergelijkbare manier verbetert als CFG, zonder afhankelijk te zijn van enige conditionele informatie.
English
Classifier-free guidance (CFG) has become the standard method for enhancing the quality of conditional diffusion models. However, employing CFG requires either training an unconditional model alongside the main diffusion model or modifying the training procedure by periodically inserting a null condition. There is also no clear extension of CFG to unconditional models. In this paper, we revisit the core principles of CFG and introduce a new method, independent condition guidance (ICG), which provides the benefits of CFG without the need for any special training procedures. Our approach streamlines the training process of conditional diffusion models and can also be applied during inference on any pre-trained conditional model. Additionally, by leveraging the time-step information encoded in all diffusion networks, we propose an extension of CFG, called time-step guidance (TSG), which can be applied to any diffusion model, including unconditional ones. Our guidance techniques are easy to implement and have the same sampling cost as CFG. Through extensive experiments, we demonstrate that ICG matches the performance of standard CFG across various conditional diffusion models. Moreover, we show that TSG improves generation quality in a manner similar to CFG, without relying on any conditional information.
PDF251November 28, 2024