OmniSVG: Унифицированная модель генерации масштабируемой векторной графикиOmniSVG: A Unified Scalable Vector Graphics Generation Model
Масштабируемая векторная графика (SVG) является важным форматом изображений, широко используемым в графическом дизайне благодаря своей независимости от разрешения и возможности редактирования. Исследования в области генерации высококачественных SVG постоянно привлекают внимание как дизайнеров, так и исследователей в сообществе AIGC. Однако существующие методы либо создают неструктурированные результаты с огромными вычислительными затратами, либо ограничиваются генерацией монохромных иконок с чрезмерно упрощенной структурой. Для создания высококачественных и сложных SVG мы предлагаем OmniSVG — унифицированную платформу, которая использует предварительно обученные модели Vision-Language (VLM) для сквозной мультимодальной генерации SVG. Параметризуя команды и координаты SVG в дискретные токены, OmniSVG разделяет структурную логику и низкоуровневую геометрию для эффективного обучения, сохраняя при этом выразительность сложной структуры SVG. Для дальнейшего развития синтеза SVG мы представляем MMSVG-2M — мультимодальный набор данных, содержащий два миллиона богато аннотированных SVG-ресурсов, а также стандартизированный протокол оценки для задач условной генерации SVG. Многочисленные эксперименты показывают, что OmniSVG превосходит существующие методы и демонстрирует потенциал для интеграции в профессиональные рабочие процессы проектирования SVG.