OmniSVG: 統一スケーラブルベクターグラフィックス生成モデルOmniSVG: A Unified Scalable Vector Graphics Generation Model
Scalable Vector Graphics(SVG)は、解像度に依存せず編集可能な特性から、グラフィックデザインにおいて広く採用されている重要な画像フォーマットです。高品質なSVGの生成に関する研究は、AIGCコミュニティのデザイナーや研究者から継続的に注目を集めてきました。しかし、既存の手法は、膨大な計算コストを伴う非構造化の出力を生成するか、過度に単純化された構造のモノクロアイコンの生成に限定されています。高品質で複雑なSVGを生成するために、我々はOmniSVGを提案します。これは、事前学習済みのVision-Language Models(VLM)を活用した、エンドツーエンドのマルチモーダルSVG生成の統一フレームワークです。SVGコマンドと座標を離散トークンとしてパラメータ化することで、OmniSVGは構造的なロジックを低レベルのジオメトリから切り離し、複雑なSVG構造の表現力を維持しながら効率的な学習を実現します。さらに、SVG合成の開発を促進するために、200万の豊富な注釈付きSVGアセットを含むマルチモーダルデータセットMMSVG-2Mと、条件付きSVG生成タスクのための標準化された評価プロトコルを導入します。大規模な実験により、OmniSVGが既存の手法を凌駕し、プロフェッショナルなSVGデザインワークフローへの統合の可能性を示しています。