ChatPaper.aiChatPaper

SwapAnything: Mogelijk maken van willekeurige objectwisselingen in gepersonaliseerde visuele bewerking

SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing

April 8, 2024
Auteurs: Jing Gu, Yilin Wang, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang
cs.AI

Samenvatting

Effectief bewerken van persoonlijke content speelt een cruciale rol bij het mogelijk maken voor individuen om hun creativiteit te uiten, boeiende verhalen te weven binnen hun visuele verhalen, en de algehele kwaliteit en impact van hun visuele content te verhogen. Daarom introduceren we in dit werk SwapAnything, een nieuw framework dat elk object in een afbeelding kan verwisselen met gepersonaliseerde concepten die door een referentie worden gegeven, terwijl de context ongewijzigd blijft. In vergelijking met bestaande methoden voor gepersonaliseerde onderwerpverwisseling, heeft SwapAnything drie unieke voordelen: (1) precieze controle over willekeurige objecten en delen in plaats van het hoofdonderwerp, (2) een getrouwere bewaring van contextpixels, (3) een betere aanpassing van het gepersonaliseerde concept aan de afbeelding. Eerst stellen we gerichte variabele verwisseling voor om regiocontrole toe te passen op latente kenmerkkaarten en gemaskeerde variabelen te verwisselen voor getrouwe contextbewaring en initiële semantische conceptverwisseling. Vervolgens introduceren we uiterlijke aanpassing, om het semantische concept naadloos aan te passen aan de originele afbeelding wat betreft doelpositie, vorm, stijl en inhoud tijdens het beeldgeneratieproces. Uitgebreide resultaten van zowel menselijke als automatische evaluatie tonen significante verbeteringen van onze aanpak ten opzichte van baseline-methoden bij gepersonaliseerde verwisseling. Bovendien toont SwapAnything zijn precieze en getrouwe verwisselingsvaardigheden bij taken met één object, meerdere objecten, gedeeltelijke objecten en cross-domein verwisseling. SwapAnything presteert ook uitstekend bij tekstgebaseerde verwisseling en taken buiten verwisseling, zoals objectinvoeging.
English
Effective editing of personal content holds a pivotal role in enabling individuals to express their creativity, weaving captivating narratives within their visual stories, and elevate the overall quality and impact of their visual content. Therefore, in this work, we introduce SwapAnything, a novel framework that can swap any objects in an image with personalized concepts given by the reference, while keeping the context unchanged. Compared with existing methods for personalized subject swapping, SwapAnything has three unique advantages: (1) precise control of arbitrary objects and parts rather than the main subject, (2) more faithful preservation of context pixels, (3) better adaptation of the personalized concept to the image. First, we propose targeted variable swapping to apply region control over latent feature maps and swap masked variables for faithful context preservation and initial semantic concept swapping. Then, we introduce appearance adaptation, to seamlessly adapt the semantic concept into the original image in terms of target location, shape, style, and content during the image generation process. Extensive results on both human and automatic evaluation demonstrate significant improvements of our approach over baseline methods on personalized swapping. Furthermore, SwapAnything shows its precise and faithful swapping abilities across single object, multiple objects, partial object, and cross-domain swapping tasks. SwapAnything also achieves great performance on text-based swapping and tasks beyond swapping such as object insertion.
PDF260December 15, 2024