CreatiPoster: Auf dem Weg zu editierbarer und steuerbarer Multi-Layer-Grafikdesign-Generierung
CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation
June 12, 2025
Autoren: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI
Zusammenfassung
Grafikdesign spielt sowohl im kommerziellen als auch im persönlichen Kontext eine entscheidende Rolle, doch die Erstellung hochwertiger, bearbeitbarer und ästhetisch ansprechender Grafikkompositionen bleibt eine zeitaufwändige und fachkundige Aufgabe, insbesondere für Anfänger. Aktuelle KI-Tools automatisieren Teile des Workflows, haben jedoch Schwierigkeiten, benutzerspezifische Assets präzise einzubinden, die Bearbeitbarkeit zu gewährleisten und professionelle visuelle Anziehungskraft zu erreichen. Kommerzielle Systeme wie Canva Magic Design setzen auf umfangreiche Template-Bibliotheken, die jedoch schwer zu replizieren sind. In diesem Artikel stellen wir CreatiPoster vor, ein Framework, das bearbeitbare, mehrschichtige Kompositionen aus optionalen natürlichen Sprachanweisungen oder Assets generiert. Ein Protokollmodell, ein RGBA-großes multimodales Modell, erstellt zunächst eine JSON-Spezifikation, die jede Ebene (Text oder Asset) mit präziser Layout-, Hierarchie-, Inhalts- und Stilangabe sowie einem prägnanten Hintergrund-Prompt detailliert beschreibt. Ein bedingtes Hintergrundmodell synthetisiert dann einen kohärenten Hintergrund, der auf diesen gerenderten Vordergrundebenen basiert. Wir erstellen einen Benchmark mit automatisierten Metriken für die Grafikdesign-Generierung und zeigen, dass CreatiPoster führende Open-Source-Ansätze sowie proprietäre kommerzielle Systeme übertrifft. Um weitere Forschungen zu fördern, veröffentlichen wir ein urheberrechtsfreies Korpus von 100.000 mehrschichtigen Designs. CreatiPoster unterstützt vielfältige Anwendungen wie Canvas-Bearbeitung, Textüberlagerung, responsives Skalieren, mehrsprachige Anpassung und animierte Poster und trägt so zur Demokratisierung von KI-gestütztem Grafikdesign bei. Projekt-Homepage: https://github.com/graphic-design-ai/creatiposter
English
Graphic design plays a crucial role in both commercial and personal contexts,
yet creating high-quality, editable, and aesthetically pleasing graphic
compositions remains a time-consuming and skill-intensive task, especially for
beginners. Current AI tools automate parts of the workflow, but struggle to
accurately incorporate user-supplied assets, maintain editability, and achieve
professional visual appeal. Commercial systems, like Canva Magic Design, rely
on vast template libraries, which are impractical for replicate. In this paper,
we introduce CreatiPoster, a framework that generates editable, multi-layer
compositions from optional natural-language instructions or assets. A protocol
model, an RGBA large multimodal model, first produces a JSON specification
detailing every layer (text or asset) with precise layout, hierarchy, content
and style, plus a concise background prompt. A conditional background model
then synthesizes a coherent background conditioned on this rendered foreground
layers. We construct a benchmark with automated metrics for graphic-design
generation and show that CreatiPoster surpasses leading open-source approaches
and proprietary commercial systems. To catalyze further research, we release a
copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports
diverse applications such as canvas editing, text overlay, responsive resizing,
multilingual adaptation, and animated posters, advancing the democratization of
AI-assisted graphic design. Project homepage:
https://github.com/graphic-design-ai/creatiposter