想像一下:無需調參的個性化圖像生成Imagine yourself: Tuning-Free Personalized Image Generation
擴散模型在各種影像對影像任務中展現出卓越的效能。在這項研究中,我們介紹了Imagine yourself,這是一個專為個性化影像生成而設計的最先進模型。與傳統基於調整的個性化技術不同,Imagine yourself 是一個無需調整的模型,使所有用戶能夠利用共享框架而無需個別調整。此外,先前的工作在保持身份特徵、遵循複雜提示和保留良好視覺品質方面遇到挑戰,導致模型對參考影像具有較強的複製黏貼效應。因此,它們幾乎無法生成遵循需要對參考影像進行重大更改的提示的影像,例如更改面部表情、頭部和身體姿勢,並且生成的影像多樣性較低。為解決這些限制,我們提出的方法引入了1)一種新的合成配對數據生成機制以鼓勵影像多樣性,2)一種具有三個文本編碼器和一個完全可訓練視覺編碼器的全並行注意力架構以提高文本忠實度,以及3)一種新穎的從粗到細的多階段微調方法,逐漸推動視覺品質的邊界。我們的研究表明,Imagine yourself 超越了最先進的個性化模型,在身份保留、視覺品質和文本對齊方面展現出卓越的能力。該模型為各種個性化應用奠定了堅實基礎。人類評估結果驗證了該模型在所有方面(身份保留、文本忠實度和視覺吸引力)上相對於先前的個性化模型具有最先進的優越性。