LayerTracer: Sintesi SVG stratificata allineata cognitivamente tramite Diffusion Transformer

Abstract

La generazione di SVG stratificati allineati alla cognizione rimane una sfida a causa delle tendenze dei metodi esistenti verso output a singolo strato troppo semplificati o ridondanze di forma indotte dall'ottimizzazione. Proponiamo LayerTracer, un framework basato su trasformatore a diffusione che colma questa lacuna apprendendo i processi di creazione di SVG stratificati dei designer da un nuovo dataset di operazioni di design sequenziali. Il nostro approccio opera in due fasi: Inizialmente, un DiT condizionato al testo genera bozze di costruzione rasterizzate a più fasi che simulano i flussi di lavoro di design umani. Successivamente, la vettorizzazione strato per strato con deduplicazione del percorso produce SVG puliti ed editabili. Per la vettorizzazione delle immagini, introduciamo un meccanismo di diffusione condizionato che codifica le immagini di riferimento in token latenti, guidando la ricostruzione gerarchica preservando l'integrità strutturale. Estesi esperimenti dimostrano le prestazioni superiori di LayerTracer rispetto a baselines basate sull'ottimizzazione e neurali sia in termini di qualità della generazione che di editabilità, allineando efficacemente i vettori generati dall'IA con la cognizione professionale del design.

English

Generating cognitive-aligned layered SVGs remains challenging due to existing methods' tendencies toward either oversimplified single-layer outputs or optimization-induced shape redundancies. We propose LayerTracer, a diffusion transformer based framework that bridges this gap by learning designers' layered SVG creation processes from a novel dataset of sequential design operations. Our approach operates in two phases: First, a text-conditioned DiT generates multi-phase rasterized construction blueprints that simulate human design workflows. Second, layer-wise vectorization with path deduplication produces clean, editable SVGs. For image vectorization, we introduce a conditional diffusion mechanism that encodes reference images into latent tokens, guiding hierarchical reconstruction while preserving structural integrity. Extensive experiments demonstrate LayerTracer's superior performance against optimization-based and neural baselines in both generation quality and editability, effectively aligning AI-generated vectors with professional design cognition.

LayerTracer: Sintesi SVG stratificata allineata cognitivamente tramite Diffusion Transformer

LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

Abstract

Support