引导与重缩放:实现高效免调谐真实图像编辑的自引导机制Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free
Real Image Editing
儘管大規模文本到圖像生成模型近期取得了進展,利用這些模型對真實圖像進行操控仍是一個具有挑戰性的問題。現有編輯方法的主要局限在於,它們要麼無法在廣泛的圖像編輯範圍內保持一致的質量,要麼需要耗時的超參數調整或對擴散模型進行微調,以保留輸入圖像的特定外觀。我們提出了一種新穎的方法,該方法基於通過引導機制修改的擴散採樣過程。在本研究中,我們探索了自引導技術,以保留輸入圖像的整體結構及其不應被編輯的局部區域外觀。特別是,我們明確引入了旨在保存源圖像局部和全局結構的佈局保持能量函數。此外,我們提出了一種噪聲重縮放機制,該機制通過在生成過程中平衡無分類器引導與我們提出的引導器的範數來保持噪聲分佈。這種引導方法無需對擴散模型進行微調和精確的反轉過程。因此,所提出的方法提供了一種快速且高質量的編輯機制。在我們的實驗中,通過人類評估和定量分析,我們展示了所提出的方法能夠產生更受人類青睞的期望編輯,並且在編輯質量與原始圖像保留之間實現了更好的平衡。我們的代碼可在https://github.com/FusionBrainLab/Guide-and-Rescale獲取。