拡散におけるファインマン-カック補正器:アニーリング、ガイダンス、およびエキスパートの積
Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts
March 4, 2025
著者: Marta Skreta, Tara Akhound-Sadegh, Viktor Ohanesian, Roberto Bondesan, Alán Aspuru-Guzik, Arnaud Doucet, Rob Brekelmans, Alexander Tong, Kirill Neklyudov
cs.AI
要旨
スコアベース生成モデルは多様な領域で選択されるモデルであるが、推論時の挙動を原理的に制御するためのツールは限られている。例えば、複数の事前学習済みモデルを組み合わせる場合などである。既存の分類器不要ガイダンス手法は、単純なヒューリスティックを用いて条件付きスコアと無条件スコアを混合し、条件付き分布からのサンプリングを近似的に行う。しかし、このような手法は中間分布を近似しないため、追加の「補正」ステップが必要となる。本研究では、事前学習済みスコアベースモデルから導出されたアニーリング、幾何平均、または積分布の系列からのサンプリングを行うための効率的で原理的な手法を提供する。我々は、適切な偏微分方程式(PDE)の項を注意深く考慮することにより、有名なファインマン・カックの公式に基づいた重み付きシミュレーションスキームを導出し、これをファインマン・カック補正器(FKC)と呼ぶ。これらのPDEをシミュレートするために、推論時のスケーリングを活用してサンプリング品質を向上させる逐次モンテカルロ(SMC)リサンプリングアルゴリズムを提案する。我々は、推論時の温度アニーリングによる償却サンプリングの提案、事前学習済みモデルを用いた多目的分子生成の改善、およびテキストから画像生成のための分類器不要ガイダンスの改善を通じて、本手法の有用性を実証的に示す。コードはhttps://github.com/martaskrt/fkc-diffusionで公開されている。
English
While score-based generative models are the model of choice across diverse
domains, there are limited tools available for controlling inference-time
behavior in a principled manner, e.g. for composing multiple pretrained models.
Existing classifier-free guidance methods use a simple heuristic to mix
conditional and unconditional scores to approximately sample from conditional
distributions. However, such methods do not approximate the intermediate
distributions, necessitating additional 'corrector' steps. In this work, we
provide an efficient and principled method for sampling from a sequence of
annealed, geometric-averaged, or product distributions derived from pretrained
score-based models. We derive a weighted simulation scheme which we call
Feynman-Kac Correctors (FKCs) based on the celebrated Feynman-Kac formula by
carefully accounting for terms in the appropriate partial differential
equations (PDEs). To simulate these PDEs, we propose Sequential Monte Carlo
(SMC) resampling algorithms that leverage inference-time scaling to improve
sampling quality. We empirically demonstrate the utility of our methods by
proposing amortized sampling via inference-time temperature annealing,
improving multi-objective molecule generation using pretrained models, and
improving classifier-free guidance for text-to-image generation. Our code is
available at https://github.com/martaskrt/fkc-diffusion.Summary
AI-Generated Summary