LayerTracer: Kognitiv-ausgerichtete geschichtete SVG-Synthese mittels Diffusionstransformator
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
February 3, 2025
Autoren: Yiren Song, Danze Chen, Mike Zheng Shou
cs.AI
Zusammenfassung
Die Generierung kognitiv ausgerichteter geschichteter SVGs bleibt aufgrund der Tendenz bestehender Methoden zu entweder zu vereinfachten einlagigen Ausgaben oder durch Optimierung verursachten Formredundanzen herausfordernd. Wir schlagen LayerTracer vor, ein auf dem Diffusionstransformer basierendes Framework, das diese Lücke überbrückt, indem es die geschichteten SVG-Erstellungsprozesse von Designern aus einem neuartigen Datensatz sequenzieller Designoperationen lernt. Unser Ansatz arbeitet in zwei Phasen: Zunächst generiert ein textkonditionierter DiT mehrphasige rasterisierte Konstruktionsgrundrisse, die menschliche Design-Workflows simulieren. Anschließend erfolgt eine schichtweise Vektorisierung mit Pfad-Deduplizierung, um saubere, bearbeitbare SVGs zu erstellen. Für die Bildvektorisierung führen wir einen bedingten Diffusionsmechanismus ein, der Referenzbilder in latente Tokens codiert, um eine hierarchische Rekonstruktion unter Beibehaltung der Strukturintegrität zu führen. Umfangreiche Experimente zeigen die überlegene Leistung von LayerTracer gegenüber auf Optimierung basierenden und neuronalen Basislinien sowohl in der Generierungsqualität als auch in der Bearbeitbarkeit auf und bringen KI-generierte Vektoren effektiv mit professioneller Designkognition in Einklang.
English
Generating cognitive-aligned layered SVGs remains challenging due to existing
methods' tendencies toward either oversimplified single-layer outputs or
optimization-induced shape redundancies. We propose LayerTracer, a diffusion
transformer based framework that bridges this gap by learning designers'
layered SVG creation processes from a novel dataset of sequential design
operations. Our approach operates in two phases: First, a text-conditioned DiT
generates multi-phase rasterized construction blueprints that simulate human
design workflows. Second, layer-wise vectorization with path deduplication
produces clean, editable SVGs. For image vectorization, we introduce a
conditional diffusion mechanism that encodes reference images into latent
tokens, guiding hierarchical reconstruction while preserving structural
integrity. Extensive experiments demonstrate LayerTracer's superior performance
against optimization-based and neural baselines in both generation quality and
editability, effectively aligning AI-generated vectors with professional design
cognition.Summary
AI-Generated Summary