ChatPaper.aiChatPaper

LayerTracer: Kognitiv-ausgerichtete geschichtete SVG-Synthese mittels Diffusionstransformator

LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

February 3, 2025
Autoren: Yiren Song, Danze Chen, Mike Zheng Shou
cs.AI

Zusammenfassung

Die Generierung kognitiv ausgerichteter geschichteter SVGs bleibt aufgrund der Tendenz bestehender Methoden zu entweder zu vereinfachten einlagigen Ausgaben oder durch Optimierung verursachten Formredundanzen herausfordernd. Wir schlagen LayerTracer vor, ein auf dem Diffusionstransformer basierendes Framework, das diese Lücke überbrückt, indem es die geschichteten SVG-Erstellungsprozesse von Designern aus einem neuartigen Datensatz sequenzieller Designoperationen lernt. Unser Ansatz arbeitet in zwei Phasen: Zunächst generiert ein textkonditionierter DiT mehrphasige rasterisierte Konstruktionsgrundrisse, die menschliche Design-Workflows simulieren. Anschließend erfolgt eine schichtweise Vektorisierung mit Pfad-Deduplizierung, um saubere, bearbeitbare SVGs zu erstellen. Für die Bildvektorisierung führen wir einen bedingten Diffusionsmechanismus ein, der Referenzbilder in latente Tokens codiert, um eine hierarchische Rekonstruktion unter Beibehaltung der Strukturintegrität zu führen. Umfangreiche Experimente zeigen die überlegene Leistung von LayerTracer gegenüber auf Optimierung basierenden und neuronalen Basislinien sowohl in der Generierungsqualität als auch in der Bearbeitbarkeit auf und bringen KI-generierte Vektoren effektiv mit professioneller Designkognition in Einklang.
English
Generating cognitive-aligned layered SVGs remains challenging due to existing methods' tendencies toward either oversimplified single-layer outputs or optimization-induced shape redundancies. We propose LayerTracer, a diffusion transformer based framework that bridges this gap by learning designers' layered SVG creation processes from a novel dataset of sequential design operations. Our approach operates in two phases: First, a text-conditioned DiT generates multi-phase rasterized construction blueprints that simulate human design workflows. Second, layer-wise vectorization with path deduplication produces clean, editable SVGs. For image vectorization, we introduce a conditional diffusion mechanism that encodes reference images into latent tokens, guiding hierarchical reconstruction while preserving structural integrity. Extensive experiments demonstrate LayerTracer's superior performance against optimization-based and neural baselines in both generation quality and editability, effectively aligning AI-generated vectors with professional design cognition.

Summary

AI-Generated Summary

PDF204February 6, 2025