ChatPaper.aiChatPaper

LayerTracer: Cognitief-uitgelijnde gelaagde SVG-synthese via Diffusion Transformer

LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

February 3, 2025
Auteurs: Yiren Song, Danze Chen, Mike Zheng Shou
cs.AI

Samenvatting

Het genereren van cognitief uitgelijnde gelaagde SVG's blijft uitdagend vanwege de neiging van bestaande methoden naar ofwel te vereenvoudigde enkelvoudige lagen of optimalisatie-geïnduceerde vorm-redundanties. Wij stellen LayerTracer voor, een op diffusie-transformator gebaseerd raamwerk dat deze kloof overbrugt door de gelaagde SVG-creatieprocessen van ontwerpers te leren vanuit een nieuw dataset van opeenvolgende ontwerpoperaties. Onze aanpak werkt in twee fasen: Ten eerste genereert een op tekst geconditioneerde DiT meerfasige gerasterde constructieblauwdrukken die menselijke ontwerpworkflows simuleren. Ten tweede produceert laagsgewijze vectorisatie met pad-deduplicatie schone, bewerkbare SVG's. Voor beeldvectorisatie introduceren we een conditioneel diffusiemechanisme dat referentiebeelden codeert in latente tokens, die hiërarchische reconstructie begeleiden terwijl structurele integriteit behouden blijft. Uitgebreide experimenten tonen de superieure prestaties van LayerTracer aan ten opzichte van op optimalisatie gebaseerde en neurale baselines op zowel generatiekwaliteit als bewerkbaarheid, waarbij AI-generatievectoren effectief worden afgestemd op professionele ontwerpcognitie.
English
Generating cognitive-aligned layered SVGs remains challenging due to existing methods' tendencies toward either oversimplified single-layer outputs or optimization-induced shape redundancies. We propose LayerTracer, a diffusion transformer based framework that bridges this gap by learning designers' layered SVG creation processes from a novel dataset of sequential design operations. Our approach operates in two phases: First, a text-conditioned DiT generates multi-phase rasterized construction blueprints that simulate human design workflows. Second, layer-wise vectorization with path deduplication produces clean, editable SVGs. For image vectorization, we introduce a conditional diffusion mechanism that encodes reference images into latent tokens, guiding hierarchical reconstruction while preserving structural integrity. Extensive experiments demonstrate LayerTracer's superior performance against optimization-based and neural baselines in both generation quality and editability, effectively aligning AI-generated vectors with professional design cognition.

Summary

AI-Generated Summary

PDF204February 6, 2025