ChatPaper.aiChatPaper

CreatiPoster: Rumo à Geração de Design Gráfico em Múltiplas Camadas Editável e Controlável

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
Autores: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

Resumo

O design gráfico desempenha um papel crucial tanto em contextos comerciais quanto pessoais, mas a criação de composições gráficas de alta qualidade, editáveis e esteticamente agradáveis continua sendo uma tarefa demorada e que exige habilidades, especialmente para iniciantes. As ferramentas de IA atuais automatizam partes do fluxo de trabalho, mas lutam para incorporar com precisão ativos fornecidos pelo usuário, manter a editabilidade e alcançar um apelo visual profissional. Sistemas comerciais, como o Canva Magic Design, dependem de vastas bibliotecas de modelos, que são impraticáveis de replicar. Neste artigo, apresentamos o CreatiPoster, um framework que gera composições editáveis e multicamadas a partir de instruções em linguagem natural ou ativos opcionais. Um modelo de protocolo, um modelo multimodal grande RGBA, primeiro produz uma especificação JSON detalhando cada camada (texto ou ativo) com layout preciso, hierarquia, conteúdo e estilo, além de um prompt de fundo conciso. Um modelo de fundo condicional então sintetiza um fundo coerente condicionado a essas camadas de primeiro plano renderizadas. Construímos um benchmark com métricas automatizadas para geração de design gráfico e mostramos que o CreatiPoster supera as principais abordagens de código aberto e sistemas comerciais proprietários. Para catalisar mais pesquisas, liberamos um corpus livre de direitos autorais com 100.000 designs multicamadas. O CreatiPoster suporta diversas aplicações, como edição de canvas, sobreposição de texto, redimensionamento responsivo, adaptação multilíngue e pôsteres animados, avançando a democratização do design gráfico assistido por IA. Página do projeto: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025