ChatPaper.aiChatPaper

CreatiPoster: В направлении редактируемой и управляемой генерации многослойного графического дизайна

CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation

June 12, 2025
Авторы: Zhao Zhang, Yutao Cheng, Dexiang Hong, Maoke Yang, Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu
cs.AI

Аннотация

Графический дизайн играет ключевую роль как в коммерческих, так и в личных контекстах, однако создание высококачественных, редактируемых и эстетически привлекательных графических композиций остается трудоемкой и требующей навыков задачей, особенно для начинающих. Современные инструменты на основе искусственного интеллекта автоматизируют части рабочего процесса, но сталкиваются с трудностями в точном включении предоставленных пользователем ресурсов, сохранении редактируемости и достижении профессионального визуального уровня. Коммерческие системы, такие как Canva Magic Design, полагаются на обширные библиотеки шаблонов, которые сложно воспроизвести. В данной статье мы представляем CreatiPoster — фреймворк, который генерирует редактируемые многослойные композиции на основе необязательных инструкций на естественном языке или предоставленных ресурсов. Протокольная модель, RGBA крупная мультимодальная модель, сначала создает JSON-спецификацию, детализирующую каждый слой (текст или ресурс) с точным макетом, иерархией, содержанием и стилем, а также кратким описанием фона. Затем условная модель фона синтезирует согласованный фон, учитывая эти отрисованные передние слои. Мы создаем эталонный набор с автоматизированными метриками для генерации графического дизайна и показываем, что CreatiPoster превосходит ведущие подходы с открытым исходным кодом и проприетарные коммерческие системы. Для стимулирования дальнейших исследований мы публикуем свободный от авторских прав корпус из 100 000 многослойных дизайнов. CreatiPoster поддерживает разнообразные приложения, такие как редактирование холста, наложение текста, адаптивное изменение размера, многоязычную адаптацию и анимированные постеры, способствуя демократизации графического дизайна с помощью ИИ. Домашняя страница проекта: https://github.com/graphic-design-ai/creatiposter.
English
Graphic design plays a crucial role in both commercial and personal contexts, yet creating high-quality, editable, and aesthetically pleasing graphic compositions remains a time-consuming and skill-intensive task, especially for beginners. Current AI tools automate parts of the workflow, but struggle to accurately incorporate user-supplied assets, maintain editability, and achieve professional visual appeal. Commercial systems, like Canva Magic Design, rely on vast template libraries, which are impractical for replicate. In this paper, we introduce CreatiPoster, a framework that generates editable, multi-layer compositions from optional natural-language instructions or assets. A protocol model, an RGBA large multimodal model, first produces a JSON specification detailing every layer (text or asset) with precise layout, hierarchy, content and style, plus a concise background prompt. A conditional background model then synthesizes a coherent background conditioned on this rendered foreground layers. We construct a benchmark with automated metrics for graphic-design generation and show that CreatiPoster surpasses leading open-source approaches and proprietary commercial systems. To catalyze further research, we release a copyright-free corpus of 100,000 multi-layer designs. CreatiPoster supports diverse applications such as canvas editing, text overlay, responsive resizing, multilingual adaptation, and animated posters, advancing the democratization of AI-assisted graphic design. Project homepage: https://github.com/graphic-design-ai/creatiposter
PDF102June 13, 2025