DreamPoster: 이미지 조건 기반 생성형 포스터 디자인을 위한 통합 프레임워크
DreamPoster: A Unified Framework for Image-Conditioned Generative Poster Design
July 6, 2025
저자: Xiwei Hu, Haokun Chen, Zhongqi Qi, Hui Zhang, Dexiang Hong, Jie Shao, Xinglong Wu
cs.AI
초록
우리는 사용자가 제공한 이미지와 텍스트 프롬프트를 기반으로 콘텐츠 충실도를 유지하면서도 유연한 해상도와 레이아웃 출력을 지원하는 고품질 포스터를 지능적으로 합성하는 텍스트-이미지 생성 프레임워크인 DreamPoster를 소개합니다. 구체적으로, DreamPoster는 다양한 포스터 생성 유형을 균일하게 처리하기 위해 우리의 T2I 모델인 Seedream3.0을 기반으로 구축되었습니다. 데이터셋 구축을 위해, 우리는 포스터 이미지 내의 텍스트 콘텐츠와 타이포그래피 계층 구조 정보를 정밀하게 주석 처리하는 체계적인 데이터 주석 파이프라인을 제안하며, 원본 자료(예: 원본 그래픽/텍스트)와 그에 해당하는 최종 포스터 출력으로 구성된 짝지어진 데이터셋을 구축하기 위한 포괄적인 방법론을 활용합니다. 또한, 우리는 모델이 고품질 생성을 유지하면서도 다중 작업 생성 능력을 계층적으로 습득할 수 있도록 점진적인 학습 전략을 구현합니다. 테스트 벤치마크에서의 평가 결과, DreamPoster는 기존 방법들에 비해 우수성을 입증하며, GPT-4o(47.56%)와 SeedEdit3.0(25.96%)에 비해 88.55%의 높은 사용성 비율을 달성했습니다. DreamPoster는 Jimeng 및 기타 Bytedance 앱에서 온라인으로 제공될 예정입니다.
English
We present DreamPoster, a Text-to-Image generation framework that
intelligently synthesizes high-quality posters from user-provided images and
text prompts while maintaining content fidelity and supporting flexible
resolution and layout outputs. Specifically, DreamPoster is built upon our T2I
model, Seedream3.0 to uniformly process different poster generating types. For
dataset construction, we propose a systematic data annotation pipeline that
precisely annotates textual content and typographic hierarchy information
within poster images, while employing comprehensive methodologies to construct
paired datasets comprising source materials (e.g., raw graphics/text) and their
corresponding final poster outputs. Additionally, we implement a progressive
training strategy that enables the model to hierarchically acquire multi-task
generation capabilities while maintaining high-quality generation. Evaluations
on our testing benchmarks demonstrate DreamPoster's superiority over existing
methods, achieving a high usability rate of 88.55\%, compared to GPT-4o
(47.56\%) and SeedEdit3.0 (25.96\%). DreamPoster will be online in Jimeng and
other Bytedance Apps.