Guide-and-Rescale: 効果的なチューニング不要の実画像編集のための自己ガイダンス機構Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free
Real Image Editing
大規模なテキストから画像への生成モデルの最近の進展にもかかわらず、これらのモデルを用いて実画像を操作することは依然として難しい問題である。既存の編集手法の主な制約は、広範な画像編集に対して一貫した品質を発揮できないか、あるいは入力画像の特定の外観を維持するために時間のかかるハイパーパラメータの調整や拡散モデルのファインチューニングを必要とすることである。我々は、ガイダンス機構を介した修正された拡散サンプリングプロセスに基づく新しいアプローチを提案する。本研究では、入力画像の全体的な構造と編集すべきでない局所領域の外観を維持するために、自己ガイダンス技術を探求する。特に、ソース画像の局所的および大域的な構造を保存することを目的としたレイアウト保存エネルギー関数を明示的に導入する。さらに、生成中にクラスファリーフリーガイダンスと提案するガイダーのノルムをバランスさせることで、ノイズ分布を維持するノイズ再スケーリング機構を提案する。このようなガイダンスアプローチは、拡散モデルのファインチューニングや正確な反転プロセスを必要としない。その結果、提案手法は高速で高品質な編集メカニズムを提供する。実験では、人間による評価と定量的分析を通じて、提案手法が人間により好まれる望ましい編集を実現し、編集品質と元の画像の保存の間のより良いトレードオフを達成することを示す。我々のコードはhttps://github.com/FusionBrainLab/Guide-and-Rescaleで公開されている。