ChatPaper.aiChatPaper

OmniSVG: 統一スケーラブルベクターグラフィックス生成モデル

OmniSVG: A Unified Scalable Vector Graphics Generation Model

April 8, 2025
著者: Yiying Yang, Wei Cheng, Sijin Chen, Xianfang Zeng, Jiaxu Zhang, Liao Wang, Gang Yu, Xingjun Ma, Yu-Gang Jiang
cs.AI

要旨

Scalable Vector Graphics(SVG)は、解像度に依存せず編集可能な特性から、グラフィックデザインにおいて広く採用されている重要な画像フォーマットです。高品質なSVGの生成に関する研究は、AIGCコミュニティのデザイナーや研究者から継続的に注目を集めてきました。しかし、既存の手法は、膨大な計算コストを伴う非構造化の出力を生成するか、過度に単純化された構造のモノクロアイコンの生成に限定されています。高品質で複雑なSVGを生成するために、我々はOmniSVGを提案します。これは、事前学習済みのVision-Language Models(VLM)を活用した、エンドツーエンドのマルチモーダルSVG生成の統一フレームワークです。SVGコマンドと座標を離散トークンとしてパラメータ化することで、OmniSVGは構造的なロジックを低レベルのジオメトリから切り離し、複雑なSVG構造の表現力を維持しながら効率的な学習を実現します。さらに、SVG合成の開発を促進するために、200万の豊富な注釈付きSVGアセットを含むマルチモーダルデータセットMMSVG-2Mと、条件付きSVG生成タスクのための標準化された評価プロトコルを導入します。大規模な実験により、OmniSVGが既存の手法を凌駕し、プロフェッショナルなSVGデザインワークフローへの統合の可能性を示しています。
English
Scalable Vector Graphics (SVG) is an important image format widely adopted in graphic design because of their resolution independence and editability. The study of generating high-quality SVG has continuously drawn attention from both designers and researchers in the AIGC community. However, existing methods either produces unstructured outputs with huge computational cost or is limited to generating monochrome icons of over-simplified structures. To produce high-quality and complex SVG, we propose OmniSVG, a unified framework that leverages pre-trained Vision-Language Models (VLMs) for end-to-end multimodal SVG generation. By parameterizing SVG commands and coordinates into discrete tokens, OmniSVG decouples structural logic from low-level geometry for efficient training while maintaining the expressiveness of complex SVG structure. To further advance the development of SVG synthesis, we introduce MMSVG-2M, a multimodal dataset with two million richly annotated SVG assets, along with a standardized evaluation protocol for conditional SVG generation tasks. Extensive experiments show that OmniSVG outperforms existing methods and demonstrates its potential for integration into professional SVG design workflows.

Summary

AI-Generated Summary

PDF1563April 9, 2025