ChatPaper.aiChatPaper

PosterCraft: 통합 프레임워크에서 고품질 미학적 포스터 생성 재고

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

June 12, 2025
저자: SiXiang Chen, Jianyu Lai, Jialin Gao, Tian Ye, Haoyu Chen, Hengyu Shi, Shitong Shao, Yunlong Lin, Song Fei, Zhaohu Xing, Yeying Jin, Junfeng Luo, Xiaoming Wei, Lei Zhu
cs.AI

초록

미학적으로 뛰어난 포스터를 생성하는 것은 단순한 디자인 이미지를 만드는 것보다 더 어려운 과제입니다. 이는 정확한 텍스트 렌더링뿐만 아니라 추상적인 예술적 콘텐츠, 인상적인 레이아웃, 그리고 전반적인 스타일의 조화를 원활하게 통합해야 하기 때문입니다. 이를 해결하기 위해 우리는 기존의 모듈식 파이프라인과 경직된 사전 정의된 레이아웃을 버리고, 모델이 일관성 있고 시각적으로 매력적인 구성을 자유롭게 탐색할 수 있도록 하는 통합 프레임워크인 PosterCraft를 제안합니다. PosterCraft는 고품질 포스터 생성을 최적화하기 위해 신중하게 설계된 캐스케이드 워크플로우를 사용합니다: (i) 새로 도입된 Text-Render-2M 데이터셋을 통한 대규모 텍스트 렌더링 최적화; (ii) HQ-Poster100K를 통한 지역 인식 지도 미세 조정; (iii) best-of-n 선호 최적화를 통한 미학적 텍스트 강화 학습; 그리고 (iv) 시각-언어 피드백을 통한 공동 정제. 각 단계는 특정 요구에 맞춰 완전히 자동화된 데이터 구축 파이프라인으로 지원되어 복잡한 아키텍처 수정 없이도 강력한 학습이 가능합니다. 다양한 실험을 통해 평가된 PosterCraft는 렌더링 정확도, 레이아웃 일관성, 그리고 전반적인 시각적 매력 면에서 오픈소스 기준선을 크게 능가하며, 최신 상용 시스템의 품질에 근접합니다. 우리의 코드, 모델, 그리고 데이터셋은 프로젝트 페이지에서 확인할 수 있습니다: https://ephemeral182.github.io/PosterCraft
English
Generating aesthetic posters is more challenging than simple design images: it requires not only precise text rendering but also the seamless integration of abstract artistic content, striking layouts, and overall stylistic harmony. To address this, we propose PosterCraft, a unified framework that abandons prior modular pipelines and rigid, predefined layouts, allowing the model to freely explore coherent, visually compelling compositions. PosterCraft employs a carefully designed, cascaded workflow to optimize the generation of high-aesthetic posters: (i) large-scale text-rendering optimization on our newly introduced Text-Render-2M dataset; (ii) region-aware supervised fine-tuning on HQ-Poster100K; (iii) aesthetic-text-reinforcement learning via best-of-n preference optimization; and (iv) joint vision-language feedback refinement. Each stage is supported by a fully automated data-construction pipeline tailored to its specific needs, enabling robust training without complex architectural modifications. Evaluated on multiple experiments, PosterCraft significantly outperforms open-source baselines in rendering accuracy, layout coherence, and overall visual appeal-approaching the quality of SOTA commercial systems. Our code, models, and datasets can be found in the Project page: https://ephemeral182.github.io/PosterCraft
PDF173June 13, 2025