ChatPaper.aiChatPaper

드림스타일: 비디오 스타일화를 위한 통합 프레임워크

DreamStyle: A Unified Framework for Video Stylization

January 6, 2026
저자: Mengtian Li, Jinshu Chen, Songtao Zhao, Wanquan Feng, Pengqi Tu, Qian He
cs.AI

초록

비디오 생성 모델의 중요한 하위 과제인 비디오 스타일화는 아직 충분히 연구되지 않았다. 이의 입력 스타일 조건에는 일반적으로 텍스트, 스타일 이미지, 스타일화된 첫 프레임이 포함된다. 각 조건은 고유한 장점을 지닌다: 텍스트는 유연성이 높고, 스타일 이미지는 더 정확한 시각적 기준을 제공하며, 스타일화된 첫 프레임은 장편 비디오 스타일화를 가능하게 한다. 그러나 기존 방법들은 대부분 단일 유형의 스타일 조건에 국한되어 적용 범위가 제한된다. 또한 고품질 데이터셋의 부재로 인해 스타일 불일치와 시간적 깜빡임이 발생한다. 이러한 한계를 해결하기 위해 우리는 통합 비디오 스타일화 프레임워크인 DreamStyle을 제안한다. 이는 (1) 텍스트 기반, (2) 스타일 이미지 기반, (3) 첫 프레임 기반 비디오 스타일화를 지원하며, 고품질 짝 지어진 비디오 데이터를 획득하기 위해 잘 설계된 데이터 큐레이션 파이프라인을 동반한다. DreamStyle은 기본 이미지-비디오(I2V) 모델을 기반으로 구축되었으며, 서로 다른 조건 토큰 간의 혼란을 줄여주는 토큰 특화 업 행렬을 적용한 LoRA(Low-Rank Adaptation)를 사용하여 학습된다. 정성적 및 정량적 평가 결과, DreamStyle은 세 가지 비디오 스타일화 과제 모두에서 우수한 성능을 보이며, 스타일 일관성과 비디오 품질에서 경쟁 방법들을 능가함을 입증하였다.
English
Video stylization, an important downstream task of video generation models, has not yet been thoroughly explored. Its input style conditions typically include text, style image, and stylized first frame. Each condition has a characteristic advantage: text is more flexible, style image provides a more accurate visual anchor, and stylized first frame makes long-video stylization feasible. However, existing methods are largely confined to a single type of style condition, which limits their scope of application. Additionally, their lack of high-quality datasets leads to style inconsistency and temporal flicker. To address these limitations, we introduce DreamStyle, a unified framework for video stylization, supporting (1) text-guided, (2) style-image-guided, and (3) first-frame-guided video stylization, accompanied by a well-designed data curation pipeline to acquire high-quality paired video data. DreamStyle is built on a vanilla Image-to-Video (I2V) model and trained using a Low-Rank Adaptation (LoRA) with token-specific up matrices that reduces the confusion among different condition tokens. Both qualitative and quantitative evaluations demonstrate that DreamStyle is competent in all three video stylization tasks, and outperforms the competitors in style consistency and video quality.
PDF171January 8, 2026