事前学習済み拡散モデルのための顔アダプタ:細粒度IDと属性制御によるFace Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and
Attribute Control
現在の顔リエンクトメントおよびスワッピング手法は主にGANフレームワークに依存しているが、最近では優れた生成能力を持つ事前学習済み拡散モデルへの関心が高まっている。しかし、これらのモデルの学習には多大なリソースが必要であり、結果もまだ満足のいく性能レベルに達していない。この問題を解決するため、我々は事前学習済み拡散モデルのための高精度かつ高忠実度な顔編集を実現する効率的で効果的なアダプタであるFace-Adapterを提案する。顔リエンクトメントとスワッピングの両タスクは、本質的に対象の構造、ID、属性の組み合わせを含むことに着目した。我々はこれらの要素の制御を十分に分離し、一つのモデルで両タスクを達成することを目指す。具体的には、以下の要素を含む:1)正確なランドマークと背景を提供する空間条件生成器、2)トランスフォーマーデコーダにより顔埋め込みをテキスト空間に変換するプラグアンドプレイ型IDエンコーダ、3)空間条件と詳細な属性を統合する属性コントローラ。Face-Adapterは、フルファインチューニングされた顔リエンクトメント/スワッピングモデルと比較して、動作制御精度、ID保持能力、生成品質において同等あるいは優れた性能を達成する。さらに、Face-Adapterは様々なStableDiffusionモデルとシームレスに統合可能である。