OmniSVG: 통합 확장 가능 벡터 그래픽 생성 모델
OmniSVG: A Unified Scalable Vector Graphics Generation Model
April 8, 2025
저자: Yiying Yang, Wei Cheng, Sijin Chen, Xianfang Zeng, Jiaxu Zhang, Liao Wang, Gang Yu, Xingjun Ma, Yu-Gang Jiang
cs.AI
초록
확장 가능 벡터 그래픽스(SVG)는 해상도 독립성과 편집 가능성으로 인해 그래픽 디자인 분야에서 널리 채택된 중요한 이미지 형식입니다. 고품질 SVG 생성에 대한 연구는 AIGC 커뮤니티의 디자이너와 연구자들로부터 지속적으로 관심을 받아 왔습니다. 그러나 기존 방법들은 과도한 계산 비용이 드는 비구조적 출력을 생성하거나 지나치게 단순화된 구조의 단색 아이콘 생성에만 국한되는 한계가 있었습니다. 고품질의 복잡한 SVG를 생성하기 위해, 우리는 사전 학습된 시각-언어 모델(VLMs)을 활용한 종단간 다중모달 SVG 생성 프레임워크인 OmniSVG를 제안합니다. OmniSVG는 SVG 명령어와 좌표를 이산 토큰으로 매개변수화함으로써 복잡한 SVG 구조의 표현력을 유지하면서도 구조적 논리를 저수준 기하학적 요소로부터 분리하여 효율적인 학습을 가능하게 합니다. 또한 SVG 합성 기술의 발전을 촉진하기 위해, 200만 개의 풍부한 주석이 달린 SVG 자산을 포함한 다중모달 데이터셋 MMSVG-2M과 조건부 SVG 생성 작업을 위한 표준화된 평가 프로토콜을 소개합니다. 광범위한 실험을 통해 OmniSVG가 기존 방법들을 능가하며 전문 SVG 디자인 워크플로우에 통합될 잠재력을 보여줍니다.
English
Scalable Vector Graphics (SVG) is an important image format widely adopted in
graphic design because of their resolution independence and editability. The
study of generating high-quality SVG has continuously drawn attention from both
designers and researchers in the AIGC community. However, existing methods
either produces unstructured outputs with huge computational cost or is limited
to generating monochrome icons of over-simplified structures. To produce
high-quality and complex SVG, we propose OmniSVG, a unified framework that
leverages pre-trained Vision-Language Models (VLMs) for end-to-end multimodal
SVG generation. By parameterizing SVG commands and coordinates into discrete
tokens, OmniSVG decouples structural logic from low-level geometry for
efficient training while maintaining the expressiveness of complex SVG
structure. To further advance the development of SVG synthesis, we introduce
MMSVG-2M, a multimodal dataset with two million richly annotated SVG assets,
along with a standardized evaluation protocol for conditional SVG generation
tasks. Extensive experiments show that OmniSVG outperforms existing methods and
demonstrates its potential for integration into professional SVG design
workflows.Summary
AI-Generated Summary