ChatPaper.aiChatPaper

CreatiPoster: Hacia la Generación Editable y Controlable de Diseños Gráficos Multicapa

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
Autores: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

Resumen

El diseño gráfico desempeña un papel crucial tanto en contextos comerciales como personales, sin embargo, la creación de composiciones gráficas de alta calidad, editables y estéticamente atractivas sigue siendo una tarea que consume tiempo y requiere habilidades especializadas, especialmente para principiantes. Las herramientas actuales de IA automatizan partes del flujo de trabajo, pero tienen dificultades para incorporar con precisión los recursos proporcionados por el usuario, mantener la editabilidad y lograr un atractivo visual profesional. Los sistemas comerciales, como Canva Magic Design, dependen de vastas bibliotecas de plantillas, lo que resulta poco práctico para replicar. En este artículo, presentamos CreatiPoster, un marco que genera composiciones editables de múltiples capas a partir de instrucciones en lenguaje natural o recursos opcionales. Un modelo de protocolo, un modelo multimodal grande RGBA, primero produce una especificación JSON que detalla cada capa (texto o recurso) con un diseño preciso, jerarquía, contenido y estilo, además de un breve indicador de fondo. Luego, un modelo de fondo condicional sintetiza un fondo coherente condicionado por estas capas de primer plano renderizadas. Construimos un punto de referencia con métricas automatizadas para la generación de diseño gráfico y demostramos que CreatiPoster supera a los enfoques de código abierto líderes y a los sistemas comerciales propietarios. Para catalizar futuras investigaciones, publicamos un corpus libre de derechos de autor de 100,000 diseños de múltiples capas. CreatiPoster admite diversas aplicaciones como la edición de lienzos, la superposición de texto, el redimensionamiento responsivo, la adaptación multilingüe y los carteles animados, avanzando en la democratización del diseño gráfico asistido por IA. Página del proyecto: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025