ChatPaper.aiChatPaper

PosterCraft: Переосмысление создания высококачественных эстетичных постеров в рамках единой архитектуры

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

June 12, 2025
Авторы: SiXiang Chen, Jianyu Lai, Jialin Gao, Tian Ye, Haoyu Chen, Hengyu Shi, Shitong Shao, Yunlong Lin, Song Fei, Zhaohu Xing, Yeying Jin, Junfeng Luo, Xiaoming Wei, Lei Zhu
cs.AI

Аннотация

Создание эстетичных постеров представляет собой более сложную задачу, чем генерация простых дизайнерских изображений: оно требует не только точного рендеринга текста, но и гармоничного сочетания абстрактного художественного содержания, выразительных композиций и общей стилистической целостности. Для решения этой проблемы мы предлагаем PosterCraft — унифицированную структуру, которая отказывается от модульных подходов и жестких, заранее заданных макетов, позволяя модели свободно исследовать согласованные и визуально привлекательные композиции. PosterCraft использует тщательно разработанный каскадный процесс для оптимизации создания высокоэстетичных постеров: (i) крупномасштабная оптимизация рендеринга текста на основе нового набора данных Text-Render-2M; (ii) регионально-ориентированное обучение с учителем на HQ-Poster100K; (iii) усиление эстетики текста через оптимизацию предпочтений best-of-n; и (iv) совместная доработка с использованием обратной связи на основе визуальных и текстовых данных. Каждый этап поддерживается полностью автоматизированным процессом создания данных, адаптированным под конкретные задачи, что обеспечивает надежное обучение без сложных архитектурных изменений. В ходе многочисленных экспериментов PosterCraft значительно превзошел открытые базовые модели по точности рендеринга, согласованности макета и общей визуальной привлекательности, приближаясь к качеству современных коммерческих систем. Наш код, модели и наборы данных доступны на странице проекта: https://ephemeral182.github.io/PosterCraft.
English
Generating aesthetic posters is more challenging than simple design images: it requires not only precise text rendering but also the seamless integration of abstract artistic content, striking layouts, and overall stylistic harmony. To address this, we propose PosterCraft, a unified framework that abandons prior modular pipelines and rigid, predefined layouts, allowing the model to freely explore coherent, visually compelling compositions. PosterCraft employs a carefully designed, cascaded workflow to optimize the generation of high-aesthetic posters: (i) large-scale text-rendering optimization on our newly introduced Text-Render-2M dataset; (ii) region-aware supervised fine-tuning on HQ-Poster100K; (iii) aesthetic-text-reinforcement learning via best-of-n preference optimization; and (iv) joint vision-language feedback refinement. Each stage is supported by a fully automated data-construction pipeline tailored to its specific needs, enabling robust training without complex architectural modifications. Evaluated on multiple experiments, PosterCraft significantly outperforms open-source baselines in rendering accuracy, layout coherence, and overall visual appeal-approaching the quality of SOTA commercial systems. Our code, models, and datasets can be found in the Project page: https://ephemeral182.github.io/PosterCraft
PDF173June 13, 2025