ChatPaper.aiChatPaper

벡터 프리즘: 의미 구조 계층화를 통한 벡터 그래픽스 애니메이션

Vector Prism: Animating Vector Graphics by Stratifying Semantic Structure

December 16, 2025
저자: Jooyeol Yun, Jaegul Choo
cs.AI

초록

확장 가능 벡터 그래픽스(SVG)는 현대 웹 디자인의 핵심 요소이며, 웹 환경이 점점 더 동적으로 변함에 따라 이를 애니메이션화하려는 수요도 지속적으로 증가하고 있습니다. 그러나 코드 생성 및 모션 계획 분야의 최근 발전에도 불구하고, 벡터 그래픽스 애니메이션 자동화는 비전-언어 모델(VLM)에게 여전히 어려운 과제로 남아 있습니다. VLM은 시각적으로 일관된 부분들이 종종 낮은 수준의 도형으로 분할되어 어떤 요소들이 함께 움직여야 하는지에 대한 지침을 거의 제공하지 않기 때문에 SVG를 정기적으로 잘못 처리합니다. 본 논문에서는 신뢰할 수 있는 SVG 애니메이션에 필요한 의미론적 구조를 복원하고 현재 VLM 시스템이 간과하고 있는 누락된 계층을 밝히는 프레임워크를 소개합니다. 이는 여러 약한 부분 예측들의 통계적 집합을 통해 달성되며, 시스템이 노이즈가 있는 예측에서 안정적으로 의미를 추론할 수 있게 합니다. SVG를 의미론적 그룹으로 재구성함으로써, 우리의 접근 방식은 VLM이 훨씬 더 일관성 있는 애니메이션을 생성할 수 있도록 합니다. 우리의 실험은 기존 접근법 대비 상당한 향상을 입증하며, 의미론적 복원이 강력한 SVG 애니메이션을 가능하게 하고 VLM과 벡터 그래픽스 간의 더 해석 가능한 상호작용을 지원하는 핵심 단계임을 시사합니다.
English
Scalable Vector Graphics (SVG) are central to modern web design, and the demand to animate them continues to grow as web environments become increasingly dynamic. Yet automating the animation of vector graphics remains challenging for vision-language models (VLMs) despite recent progress in code generation and motion planning. VLMs routinely mis-handle SVGs, since visually coherent parts are often fragmented into low-level shapes that offer little guidance of which elements should move together. In this paper, we introduce a framework that recovers the semantic structure required for reliable SVG animation and reveals the missing layer that current VLM systems overlook. This is achieved through a statistical aggregation of multiple weak part predictions, allowing the system to stably infer semantics from noisy predictions. By reorganizing SVGs into semantic groups, our approach enables VLMs to produce animations with far greater coherence. Our experiments demonstrate substantial gains over existing approaches, suggesting that semantic recovery is the key step that unlocks robust SVG animation and supports more interpretable interactions between VLMs and vector graphics.
PDF262December 18, 2025