CreatiPoster: Naar Bewerkbare en Bestuurbare Generatie van Multi-Lagige Grafische Ontwerpen
CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
June 12, 2025
Auteurs: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI
Samenvatting
Grafisch ontwerp speelt een cruciale rol in zowel commerciële als persoonlijke contexten, maar het creëren van hoogwaardige, bewerkbare en esthetisch aantrekkelijke grafische composities blijft een tijdrovende en vaardigheidsintensieve taak, vooral voor beginners. Huidige AI-tools automatiseren delen van de workflow, maar hebben moeite om door gebruikers aangeleverde assets nauwkeurig te integreren, bewerkbaarheid te behouden en een professionele visuele aantrekkingskracht te bereiken. Commerciële systemen, zoals Canva Magic Design, vertrouwen op uitgebreide templatebibliotheken, die onpraktisch zijn om te repliceren. In dit artikel introduceren we CreatiPoster, een framework dat bewerkbare, meerlaagse composities genereert uit optionele natuurlijke-taalinstructies of assets. Een protocolmodel, een RGBA groot multimodaal model, produceert eerst een JSON-specificatie die elke laag (tekst of asset) gedetailleerd beschrijft met precieze lay-out, hiërarchie, inhoud en stijl, plus een beknopte achtergrondprompt. Een conditioneel achtergrondmodel synthetiseert vervolgens een samenhangende achtergrond, afhankelijk van deze gerenderde voorgrondlagen. We construeren een benchmark met geautomatiseerde metrieken voor grafisch-ontwerpgeneratie en tonen aan dat CreatiPoster toonaangevende open-source benaderingen en propriëtaire commerciële systemen overtreft. Om verder onderzoek te stimuleren, geven we een auteursrechtvrije corpus vrij van 100.000 meerlaagse ontwerpen. CreatiPoster ondersteunt diverse toepassingen zoals canvasbewerking, tekstoverlay, responsief schalen, meertalige aanpassing en geanimeerde posters, waardoor de democratisering van AI-ondersteund grafisch ontwerp wordt bevorderd. Projecthomepage: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts,
yet creating high-quality, editable, and aesthetically pleasing graphic
compositions remains a time-consuming and skill-intensive task, especially for
beginners. Current AI tools automate parts of the workflow, but struggle to
accurately incorporate user-supplied assets, maintain editability, and achieve
professional visual appeal. Commercial systems, like Canva Magic Design, rely
on vast template libraries, which are impractical for replicate. In this paper,
we introduce CreatiPoster, a framework that generates editable, multi-layer
compositions from optional natural-language instructions or assets. A protocol
model, an RGBA large multimodal model, first produces a JSON specification
detailing every layer (text or asset) with precise layout, hierarchy, content
and style, plus a concise background prompt. A conditional background model
then synthesizes a coherent background conditioned on this rendered foreground
layers. We construct a benchmark with automated metrics for graphic-design
generation and show that CreatiPoster surpasses leading open-source approaches
and proprietary commercial systems. To catalyze further research, we release a
copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports
diverse applications such as canvas editing, text overlay, responsive resizing,
multilingual adaptation, and animated posters, advancing the democratization of
AI-assisted graphic design. Project homepage:
https://github.com/graphic-design-ai/creatiposter