ChatPaper.aiChatPaper

CreatiPoster: Verso una Generazione Modificabile e Controllabile di Design Grafico Multi-Livello

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
Autori: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

Abstract

La progettazione grafica svolge un ruolo cruciale sia in contesti commerciali che personali, tuttavia la creazione di composizioni grafiche di alta qualità, modificabili e esteticamente piacevoli rimane un compito dispendioso in termini di tempo e di competenze, specialmente per i principianti. Gli attuali strumenti di automazione basati sull'intelligenza artificiale automatizzano parti del flusso di lavoro, ma faticano a incorporare con precisione gli asset forniti dall'utente, mantenere la modificabilità e raggiungere un aspetto visivo professionale. I sistemi commerciali, come Canva Magic Design, si basano su ampie librerie di modelli, che sono impraticabili da replicare. In questo articolo, presentiamo CreatiPoster, un framework che genera composizioni modificabili e multi-strato a partire da istruzioni in linguaggio naturale o asset opzionali. Un modello protocollo, un modello multimodale RGBA di grandi dimensioni, produce inizialmente una specifica JSON che dettaglia ogni strato (testo o asset) con layout preciso, gerarchia, contenuto e stile, oltre a un prompt di sfondo conciso. Un modello di sfondo condizionale sintetizza quindi uno sfondo coerente condizionato da questi strati in primo piano renderizzati. Costruiamo un benchmark con metriche automatizzate per la generazione di design grafici e dimostriamo che CreatiPoster supera i principali approcci open-source e i sistemi commerciali proprietari. Per catalizzare ulteriori ricerche, rilasciamo un corpus libero da diritti d'autore di 100.000 design multi-strato. CreatiPoster supporta diverse applicazioni come l'editing su tela, la sovrapposizione di testo, il ridimensionamento responsivo, l'adattamento multilingue e i poster animati, avanzando la democratizzazione della progettazione grafica assistita dall'intelligenza artificiale. Pagina del progetto: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025