LayerComposer: Interactieve Gepersonaliseerde T2I via een Ruimtelijk Bewust Gelaagd Canvas
LayerComposer: Interactive Personalized T2I via Spatially-Aware Layered Canvas
October 23, 2025
Auteurs: Guocheng Gordon Qian, Ruihang Zhang, Tsai-Shien Chen, Yusuf Dalva, Anujraaj Argo Goyal, Willi Menapace, Ivan Skorokhodov, Meng Dong, Arpit Sahni, Daniil Ostashev, Ju Hu, Sergey Tulyakov, Kuan-Chieh Jackson Wang
cs.AI
Samenvatting
Ondanks hun indrukwekkende visuele kwaliteit missen bestaande gepersonaliseerde generatieve modellen interactieve controle over de ruimtelijke compositie en schalen ze slecht naar meerdere onderwerpen. Om deze beperkingen aan te pakken, presenteren we LayerComposer, een interactief raamwerk voor gepersonaliseerde, multi-onderwerp tekst-naar-beeld generatie. Onze aanpak introduceert twee belangrijke bijdragen: (1) een gelaagd canvas, een nieuwe representatie waarin elk onderwerp op een aparte laag wordt geplaatst, wat een samenstelling zonder occlusie mogelijk maakt; en (2) een vergrendelingsmechanisme dat geselecteerde lagen met hoge nauwkeurigheid behoudt, terwijl de overige lagen flexibel kunnen worden aangepast aan de omringende context. Vergelijkbaar met professionele beeldbewerkingssoftware stelt het voorgestelde gelaagde canvas gebruikers in staat om invoeronderwerpen te plaatsen, te vergroten/verkleinen of te vergrendelen via intuïtieve laagmanipulatie. Ons veelzijdige vergrendelingsmechanisme vereist geen architectuurwijzigingen, maar steunt in plaats daarvan op inherente positionele inbeddingen gecombineerd met een nieuwe complementaire data-samplingstrategie. Uitgebreide experimenten tonen aan dat LayerComposer superieure ruimtelijke controle en identiteitsbehoud bereikt in vergelijking met de state-of-the-art methoden voor multi-onderwerp gepersonaliseerde beeldgeneratie.
English
Despite their impressive visual fidelity, existing personalized generative
models lack interactive control over spatial composition and scale poorly to
multiple subjects. To address these limitations, we present LayerComposer, an
interactive framework for personalized, multi-subject text-to-image generation.
Our approach introduces two main contributions: (1) a layered canvas, a novel
representation in which each subject is placed on a distinct layer, enabling
occlusion-free composition; and (2) a locking mechanism that preserves selected
layers with high fidelity while allowing the remaining layers to adapt flexibly
to the surrounding context. Similar to professional image-editing software, the
proposed layered canvas allows users to place, resize, or lock input subjects
through intuitive layer manipulation. Our versatile locking mechanism requires
no architectural changes, relying instead on inherent positional embeddings
combined with a new complementary data sampling strategy. Extensive experiments
demonstrate that LayerComposer achieves superior spatial control and identity
preservation compared to the state-of-the-art methods in multi-subject
personalized image generation.