ChatPaper.aiChatPaper

SwapAnything: Ermöglichen des beliebigen Austauschs von Objekten in der personalisierten visuellen Bearbeitung

SwapAnything: Enabling Arbitrary Object Swapping in Personalized Visual Editing

April 8, 2024
Autoren: Jing Gu, Yilin Wang, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang
cs.AI

Zusammenfassung

Die effektive Bearbeitung persönlicher Inhalte spielt eine entscheidende Rolle dabei, Einzelpersonen zu ermöglichen, ihre Kreativität auszudrücken, fesselnde Erzählungen in ihren visuellen Geschichten zu weben und die Gesamtqualität und Wirkung ihrer visuellen Inhalte zu steigern. Daher stellen wir in dieser Arbeit SwapAnything vor, ein neuartiges Framework, das beliebige Objekte in einem Bild durch personalisierte Konzepte aus dem Referenzmaterial austauschen kann, während der Kontext unverändert bleibt. Im Vergleich zu bestehenden Methoden für den personalisierten Objektaustausch weist SwapAnything drei einzigartige Vorteile auf: (1) präzise Steuerung beliebiger Objekte und Teile anstelle des Hauptmotivs, (2) treuere Erhaltung von Kontextpixeln, (3) bessere Anpassung des personalisierten Konzepts an das Bild. Zunächst schlagen wir gezielten Variablentausch vor, um eine regionale Steuerung über latente Merkmalskarten anzuwenden und maskierte Variablen für die treue Erhaltung des Kontexts und den anfänglichen semantischen Konzepttausch auszutauschen. Anschließend führen wir die Erscheinungsanpassung ein, um das semantische Konzept nahtlos in das Originalbild in Bezug auf Zielort, Form, Stil und Inhalt während des Bildgenerierungsprozesses anzupassen. Umfangreiche Ergebnisse sowohl bei der menschlichen als auch bei der automatischen Bewertung zeigen signifikante Verbesserungen unseres Ansatzes gegenüber Basislinienmethoden beim personalisierten Austausch. Darüber hinaus zeigt SwapAnything seine präzisen und treuen Austauschfähigkeiten bei Aufgaben zum Austausch einzelner Objekte, mehrerer Objekte, teilweiser Objekte und domänenübergreifender Austauschaufgaben. SwapAnything erzielt auch eine hervorragende Leistung beim textbasierten Austausch und bei Aufgaben jenseits des Austauschs wie dem Einfügen von Objekten.
English
Effective editing of personal content holds a pivotal role in enabling individuals to express their creativity, weaving captivating narratives within their visual stories, and elevate the overall quality and impact of their visual content. Therefore, in this work, we introduce SwapAnything, a novel framework that can swap any objects in an image with personalized concepts given by the reference, while keeping the context unchanged. Compared with existing methods for personalized subject swapping, SwapAnything has three unique advantages: (1) precise control of arbitrary objects and parts rather than the main subject, (2) more faithful preservation of context pixels, (3) better adaptation of the personalized concept to the image. First, we propose targeted variable swapping to apply region control over latent feature maps and swap masked variables for faithful context preservation and initial semantic concept swapping. Then, we introduce appearance adaptation, to seamlessly adapt the semantic concept into the original image in terms of target location, shape, style, and content during the image generation process. Extensive results on both human and automatic evaluation demonstrate significant improvements of our approach over baseline methods on personalized swapping. Furthermore, SwapAnything shows its precise and faithful swapping abilities across single object, multiple objects, partial object, and cross-domain swapping tasks. SwapAnything also achieves great performance on text-based swapping and tasks beyond swapping such as object insertion.

Summary

AI-Generated Summary

PDF270December 15, 2024