Correcteurs de Feynman-Kac en diffusion : Recuit, Guidage et Produit d'Experts

Résumé

Bien que les modèles génératifs basés sur les scores soient le modèle de choix dans divers domaines, les outils disponibles pour contrôler de manière rigoureuse le comportement lors de l'inférence sont limités, par exemple pour composer plusieurs modèles préentraînés. Les méthodes existantes de guidage sans classificateur utilisent une heuristique simple pour mélanger les scores conditionnels et inconditionnels afin d'échantillonner approximativement à partir de distributions conditionnelles. Cependant, ces méthodes n'approximent pas les distributions intermédiaires, nécessitant des étapes supplémentaires de 'correction'. Dans ce travail, nous proposons une méthode efficace et rigoureuse pour échantillonner à partir d'une séquence de distributions recuitées, moyennées géométriquement ou produits, dérivées de modèles basés sur les scores préentraînés. Nous dérivons un schéma de simulation pondéré que nous appelons Correcteurs de Feynman-Kac (FKCs), basé sur la célèbre formule de Feynman-Kac, en tenant soigneusement compte des termes dans les équations aux dérivées partielles (EDP) appropriées. Pour simuler ces EDP, nous proposons des algorithmes de rééchantillonnage par Monte Carlo séquentiel (SMC) qui exploitent la mise à l'échelle lors de l'inférence pour améliorer la qualité de l'échantillonnage. Nous démontrons empiriquement l'utilité de nos méthodes en proposant un échantillonnage amorti via un recuit de température lors de l'inférence, en améliorant la génération de molécules multi-objectifs à l'aide de modèles préentraînés, et en améliorant le guidage sans classificateur pour la génération d'images à partir de texte. Notre code est disponible à l'adresse https://github.com/martaskrt/fkc-diffusion.

English

While score-based generative models are the model of choice across diverse domains, there are limited tools available for controlling inference-time behavior in a principled manner, e.g. for composing multiple pretrained models. Existing classifier-free guidance methods use a simple heuristic to mix conditional and unconditional scores to approximately sample from conditional distributions. However, such methods do not approximate the intermediate distributions, necessitating additional 'corrector' steps. In this work, we provide an efficient and principled method for sampling from a sequence of annealed, geometric-averaged, or product distributions derived from pretrained score-based models. We derive a weighted simulation scheme which we call Feynman-Kac Correctors (FKCs) based on the celebrated Feynman-Kac formula by carefully accounting for terms in the appropriate partial differential equations (PDEs). To simulate these PDEs, we propose Sequential Monte Carlo (SMC) resampling algorithms that leverage inference-time scaling to improve sampling quality. We empirically demonstrate the utility of our methods by proposing amortized sampling via inference-time temperature annealing, improving multi-objective molecule generation using pretrained models, and improving classifier-free guidance for text-to-image generation. Our code is available at https://github.com/martaskrt/fkc-diffusion.

Correcteurs de Feynman-Kac en diffusion : Recuit, Guidage et Produit d'Experts

Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts

Résumé

Support