CreatiPoster: 編集可能かつ制御可能な多層グラフィックデザイン生成に向けて
CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
June 12, 2025
著者: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI
要旨
グラフィックデザインは、商業的および個人的な文脈において重要な役割を果たしていますが、高品質で編集可能かつ美的に優れたグラフィックコンポジションを作成することは、特に初心者にとって時間がかかり、スキルを要する作業です。現在のAIツールはワークフローの一部を自動化していますが、ユーザーが提供したアセットを正確に組み込むこと、編集可能性を維持すること、プロフェッショナルな視覚的アピールを実現することには苦戦しています。Canva Magic Designのような商用システムは、膨大なテンプレートライブラリに依存しており、再現するには非現実的です。本論文では、オプションの自然言語指示またはアセットから編集可能な多層コンポジションを生成するフレームワークであるCreatiPosterを紹介します。プロトコルモデルであるRGBA大規模マルチモーダルモデルは、各レイヤー(テキストまたはアセット)の正確なレイアウト、階層、内容、スタイル、および簡潔な背景プロンプトを詳細に記述したJSON仕様を最初に生成します。その後、条件付き背景モデルが、このレンダリングされた前景レイヤーに基づいて一貫性のある背景を合成します。グラフィックデザイン生成のための自動化されたメトリクスを用いたベンチマークを構築し、CreatiPosterが主要なオープンソースアプローチおよびプロプライエタリな商用システムを凌駕することを示します。さらなる研究を促進するために、10万件の多層デザインからなる著作権フリーのコーパスを公開します。CreatiPosterは、キャンバス編集、テキストオーバーレイ、レスポンシブリサイズ、多言語適応、アニメーションポスターなど、多様なアプリケーションをサポートし、AI支援グラフィックデザインの民主化を推進します。プロジェクトホームページ: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts,
yet creating high-quality, editable, and aesthetically pleasing graphic
compositions remains a time-consuming and skill-intensive task, especially for
beginners. Current AI tools automate parts of the workflow, but struggle to
accurately incorporate user-supplied assets, maintain editability, and achieve
professional visual appeal. Commercial systems, like Canva Magic Design, rely
on vast template libraries, which are impractical for replicate. In this paper,
we introduce CreatiPoster, a framework that generates editable, multi-layer
compositions from optional natural-language instructions or assets. A protocol
model, an RGBA large multimodal model, first produces a JSON specification
detailing every layer (text or asset) with precise layout, hierarchy, content
and style, plus a concise background prompt. A conditional background model
then synthesizes a coherent background conditioned on this rendered foreground
layers. We construct a benchmark with automated metrics for graphic-design
generation and show that CreatiPoster surpasses leading open-source approaches
and proprietary commercial systems. To catalyze further research, we release a
copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports
diverse applications such as canvas editing, text overlay, responsive resizing,
multilingual adaptation, and animated posters, advancing the democratization of
AI-assisted graphic design. Project homepage:
https://github.com/graphic-design-ai/creatiposter