ChatPaper.aiChatPaper

CreatiPoster : Vers une génération de conception graphique multicouche modifiable et contrôlable

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
Auteurs: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

Résumé

La conception graphique joue un rôle crucial dans les contextes commerciaux et personnels, mais la création de compositions graphiques de haute qualité, modifiables et esthétiquement plaisantes reste une tâche chronophage et exigeante en compétences, en particulier pour les débutants. Les outils d'IA actuels automatisent certaines parties du processus, mais peinent à intégrer avec précision les éléments fournis par l'utilisateur, à maintenir la modifiabilité et à atteindre un attrait visuel professionnel. Les systèmes commerciaux, comme Canva Magic Design, s'appuient sur de vastes bibliothèques de modèles, qui sont peu pratiques à reproduire. Dans cet article, nous présentons CreatiPoster, un cadre qui génère des compositions multicouches modifiables à partir d'instructions en langage naturel ou d'éléments optionnels. Un modèle de protocole, un grand modèle multimodal RGBA, produit d'abord une spécification JSON détaillant chaque couche (texte ou élément) avec un positionnement précis, une hiérarchie, un contenu et un style, ainsi qu'une invite de fond concise. Un modèle de fond conditionnel synthétise ensuite un arrière-plan cohérent en fonction de ces couches de premier plan rendues. Nous construisons un benchmark avec des métriques automatisées pour la génération de conception graphique et montrons que CreatiPoster surpasse les approches open-source de pointe et les systèmes commerciaux propriétaires. Pour catalyser la recherche future, nous publions un corpus libre de droits de 100 000 conceptions multicouches. CreatiPoster prend en charge diverses applications telles que l'édition de canevas, la superposition de texte, le redimensionnement réactif, l'adaptation multilingue et les affiches animées, faisant progresser la démocratisation de la conception graphique assistée par l'IA. Page du projet : https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025