ChatPaper.aiChatPaper

LayerTracer: Синтез SVG в слоях, выровненный по когнитивным принципам, с использованием трансформера диффузии

LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

February 3, 2025
Авторы: Yiren Song, Danze Chen, Mike Zheng Shou
cs.AI

Аннотация

Генерация многоуровневых SVG-изображений, соответствующих когнитивным процессам, остается сложной задачей из-за тенденции существующих методов к либо излишне упрощенным однослойным результатам, либо лишним дублированиям форм, вызванным оптимизацией. Мы предлагаем LayerTracer, основанный на диффузионном трансформере, который преодолевает эту проблему, изучая процессы создания многоуровневых SVG-изображений дизайнеров на основе нового набора данных последовательных операций дизайна. Наш подход работает в две фазы: сначала текстовый ДиТ генерирует многофазные растеризованные чертежи конструкции, имитирующие человеческие рабочие процессы. Затем векторизация по слоям с удалением дубликатов путей создает чистые, редактируемые SVG-изображения. Для векторизации изображений мы вводим условный механизм диффузии, который кодирует эталонные изображения в латентные токены, направляя иерархическую реконструкцию, сохраняя структурную целостность. Обширные эксперименты демонстрируют превосходное качество работы LayerTracer по сравнению с оптимизационными и нейронными базовыми моделями как по качеству генерации, так и по возможности редактирования, эффективно согласуя векторы, созданные ИИ, с профессиональным дизайнерским мышлением.
English
Generating cognitive-aligned layered SVGs remains challenging due to existing methods' tendencies toward either oversimplified single-layer outputs or optimization-induced shape redundancies. We propose LayerTracer, a diffusion transformer based framework that bridges this gap by learning designers' layered SVG creation processes from a novel dataset of sequential design operations. Our approach operates in two phases: First, a text-conditioned DiT generates multi-phase rasterized construction blueprints that simulate human design workflows. Second, layer-wise vectorization with path deduplication produces clean, editable SVGs. For image vectorization, we introduce a conditional diffusion mechanism that encodes reference images into latent tokens, guiding hierarchical reconstruction while preserving structural integrity. Extensive experiments demonstrate LayerTracer's superior performance against optimization-based and neural baselines in both generation quality and editability, effectively aligning AI-generated vectors with professional design cognition.

Summary

AI-Generated Summary

PDF204February 6, 2025