ChatPaper.aiChatPaper

CreatiPoster: 편집 가능하고 제어 가능한 다중 레이어 그래픽 디자인 생성을 향하여

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
저자: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

초록

그래픽 디자인은 상업적 및 개인적 맥락에서 중요한 역할을 하지만, 고품질의 편집 가능하며 미적으로 매력적인 그래픽 작품을 만드는 것은 여전히 시간이 많이 들고 기술이 필요한 작업이며, 특히 초보자에게는 더욱 그렇습니다. 현재의 AI 도구들은 워크플로우의 일부를 자동화하지만, 사용자가 제공한 자산을 정확하게 통합하고 편집 가능성을 유지하며 전문적인 시각적 매력을 달성하는 데 어려움을 겪습니다. Canva Magic Design과 같은 상용 시스템은 방대한 템플릿 라이브러리에 의존하는데, 이를 복제하는 것은 비현실적입니다. 본 논문에서는 선택적인 자연어 지시 또는 자산으로부터 편집 가능한 다중 레이어 작품을 생성하는 CreatiPoster 프레임워크를 소개합니다. 프로토콜 모델인 RGBA 대형 멀티모달 모델은 먼저 각 레이어(텍스트 또는 자산)의 정확한 레이아웃, 계층 구조, 내용 및 스타일을 포함한 JSON 사양과 간결한 배경 프롬프트를 생성합니다. 조건부 배경 모델은 이렇게 렌더링된 전경 레이어를 기반으로 일관된 배경을 합성합니다. 우리는 그래픽 디자인 생성을 위한 자동화된 메트릭을 포함한 벤치마크를 구축하고, CreatiPoster가 주요 오픈소스 접근 방식과 상용 시스템을 능가함을 보여줍니다. 추가 연구를 촉진하기 위해 10만 개의 다중 레이어 디자인으로 구성된 저작권 없는 코퍼스를 공개합니다. CreatiPoster는 캔버스 편집, 텍스트 오버레이, 반응형 크기 조정, 다국어 적응, 애니메이션 포스터 등 다양한 응용 프로그램을 지원하며, AI 지원 그래픽 디자인의 민주화를 앞당깁니다. 프로젝트 홈페이지: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025