LayerTracer: Sintesi SVG stratificata allineata cognitivamente tramite Diffusion Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
February 3, 2025
Autori: Yiren Song, Danze Chen, Mike Zheng Shou
cs.AI
Abstract
La generazione di SVG stratificati allineati alla cognizione rimane una sfida a causa delle tendenze dei metodi esistenti verso output a singolo strato troppo semplificati o ridondanze di forma indotte dall'ottimizzazione. Proponiamo LayerTracer, un framework basato su trasformatore a diffusione che colma questa lacuna apprendendo i processi di creazione di SVG stratificati dei designer da un nuovo dataset di operazioni di design sequenziali. Il nostro approccio opera in due fasi: Inizialmente, un DiT condizionato al testo genera bozze di costruzione rasterizzate a più fasi che simulano i flussi di lavoro di design umani. Successivamente, la vettorizzazione strato per strato con deduplicazione del percorso produce SVG puliti ed editabili. Per la vettorizzazione delle immagini, introduciamo un meccanismo di diffusione condizionato che codifica le immagini di riferimento in token latenti, guidando la ricostruzione gerarchica preservando l'integrità strutturale. Estesi esperimenti dimostrano le prestazioni superiori di LayerTracer rispetto a baselines basate sull'ottimizzazione e neurali sia in termini di qualità della generazione che di editabilità, allineando efficacemente i vettori generati dall'IA con la cognizione professionale del design.
English
Generating cognitive-aligned layered SVGs remains challenging due to existing
methods' tendencies toward either oversimplified single-layer outputs or
optimization-induced shape redundancies. We propose LayerTracer, a diffusion
transformer based framework that bridges this gap by learning designers'
layered SVG creation processes from a novel dataset of sequential design
operations. Our approach operates in two phases: First, a text-conditioned DiT
generates multi-phase rasterized construction blueprints that simulate human
design workflows. Second, layer-wise vectorization with path deduplication
produces clean, editable SVGs. For image vectorization, we introduce a
conditional diffusion mechanism that encodes reference images into latent
tokens, guiding hierarchical reconstruction while preserving structural
integrity. Extensive experiments demonstrate LayerTracer's superior performance
against optimization-based and neural baselines in both generation quality and
editability, effectively aligning AI-generated vectors with professional design
cognition.Summary
AI-Generated Summary