ChatPaper.aiChatPaper

Inpaint4Drag: Riuso di Modelli di Inpainting per l'Editing di Immagini Basato sul Trascinamento tramite Warping Bidirezionale

Inpaint4Drag: Repurposing Inpainting Models for Drag-Based Image Editing via Bidirectional Warping

September 4, 2025
Autori: Jingyi Lu, Kai Han
cs.AI

Abstract

L'editing di immagini basato sul trascinamento è emerso come un paradigma potente per la manipolazione intuitiva delle immagini. Tuttavia, gli approcci esistenti si basano principalmente sulla manipolazione dello spazio latente dei modelli generativi, portando a una precisione limitata, feedback ritardati e vincoli specifici del modello. Di conseguenza, presentiamo Inpaint4Drag, un nuovo framework che scompone l'editing basato sul trascinamento in una deformazione bidirezionale nello spazio dei pixel e in un'operazione di inpainting. Ispirati dalla deformazione elastica degli oggetti nel mondo fisico, trattiamo le regioni dell'immagine come materiali deformabili che mantengono una forma naturale sotto la manipolazione dell'utente. Il nostro metodo ottiene anteprime di deformazione in tempo reale (0.01s) e un inpainting efficiente (0.3s) a una risoluzione di 512x512, migliorando significativamente l'esperienza di interazione rispetto ai metodi esistenti che richiedono minuti per ogni modifica. Trasformando direttamente gli input di trascinamento in formati standard di inpainting, il nostro approccio funge da adattatore universale per qualsiasi modello di inpainting senza necessità di modifiche architetturali, ereditando automaticamente tutti i futuri miglioramenti nella tecnologia di inpainting. Esperimenti estensivi dimostrano che il nostro metodo raggiunge una qualità visiva superiore e un controllo preciso mantenendo prestazioni in tempo reale. Pagina del progetto: https://visual-ai.github.io/inpaint4drag/
English
Drag-based image editing has emerged as a powerful paradigm for intuitive image manipulation. However, existing approaches predominantly rely on manipulating the latent space of generative models, leading to limited precision, delayed feedback, and model-specific constraints. Accordingly, we present Inpaint4Drag, a novel framework that decomposes drag-based editing into pixel-space bidirectional warping and image inpainting. Inspired by elastic object deformation in the physical world, we treat image regions as deformable materials that maintain natural shape under user manipulation. Our method achieves real-time warping previews (0.01s) and efficient inpainting (0.3s) at 512x512 resolution, significantly improving the interaction experience compared to existing methods that require minutes per edit. By transforming drag inputs directly into standard inpainting formats, our approach serves as a universal adapter for any inpainting model without architecture modification, automatically inheriting all future improvements in inpainting technology. Extensive experiments demonstrate that our method achieves superior visual quality and precise control while maintaining real-time performance. Project page: https://visual-ai.github.io/inpaint4drag/
PDF62September 9, 2025