ChatPaper.aiChatPaper

Follow-Your-Shape : Édition d'images consciente de la forme via un contrôle de région guidé par trajectoire

Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control

August 11, 2025
papers.authors: Zeqian Long, Mingzhe Zheng, Kunyu Feng, Xinhua Zhang, Hongyu Liu, Harry Yang, Linfeng Zhang, Qifeng Chen, Yue Ma
cs.AI

papers.abstract

Bien que les modèles récents d'édition d'images basés sur les flux démontrent des capacités polyvalentes sur diverses tâches, ils peinent souvent à se spécialiser dans des scénarios complexes — en particulier ceux impliquant des transformations de forme à grande échelle. Lors de telles modifications structurelles, ces méthodes échouent soit à réaliser le changement de forme souhaité, soit altèrent involontairement des régions non ciblées, ce qui dégrade la qualité de l'arrière-plan. Nous proposons Follow-Your-Shape, un cadre sans apprentissage et sans masque qui permet une édition précise et contrôlable des formes d'objets tout en préservant strictement le contenu non ciblé. Motivés par la divergence entre les trajectoires d'inversion et d'édition, nous calculons une Carte de Divergence de Trajectoire (TDM) en comparant les différences de vitesse par token entre les chemins d'inversion et de débruitage. La TDM permet une localisation précise des régions éditables et guide un mécanisme d'Injection KV Planifiée qui assure une édition stable et fidèle. Pour faciliter une évaluation rigoureuse, nous introduisons ReShapeBench, un nouveau benchmark comprenant 120 nouvelles images et des paires de prompts enrichies spécialement conçues pour l'édition consciente de la forme. Les expériences démontrent que notre méthode atteint une éditabilité et une fidélité visuelle supérieures, en particulier dans les tâches nécessitant un remplacement de forme à grande échelle.
English
While recent flow-based image editing models demonstrate general-purpose capabilities across diverse tasks, they often struggle to specialize in challenging scenarios -- particularly those involving large-scale shape transformations. When performing such structural edits, these methods either fail to achieve the intended shape change or inadvertently alter non-target regions, resulting in degraded background quality. We propose Follow-Your-Shape, a training-free and mask-free framework that supports precise and controllable editing of object shapes while strictly preserving non-target content. Motivated by the divergence between inversion and editing trajectories, we compute a Trajectory Divergence Map (TDM) by comparing token-wise velocity differences between the inversion and denoising paths. The TDM enables precise localization of editable regions and guides a Scheduled KV Injection mechanism that ensures stable and faithful editing. To facilitate a rigorous evaluation, we introduce ReShapeBench, a new benchmark comprising 120 new images and enriched prompt pairs specifically curated for shape-aware editing. Experiments demonstrate that our method achieves superior editability and visual fidelity, particularly in tasks requiring large-scale shape replacement.
PDF92August 12, 2025