PosterCraft: Een nieuwe benadering voor het genereren van hoogwaardige esthetische posters binnen een geïntegreerd raamwerk
PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework
June 12, 2025
Auteurs: SiXiang Chen, Jianyu Lai, Jialin Gao, Tian Ye, Haoyu Chen, Hengyu Shi, Shitong Shao, Yunlong Lin, Song Fei, Zhaohu Xing, Yeying Jin, Junfeng Luo, Xiaoming Wei, Lei Zhu
cs.AI
Samenvatting
Het genereren van esthetische posters is uitdagender dan het maken van eenvoudige ontwerpafbeeldingen:
het vereist niet alleen nauwkeurige tekstweergave, maar ook de naadloze integratie
van abstracte artistieke inhoud, opvallende lay-outs en algehele stilistische harmonie.
Om dit aan te pakken, stellen we PosterCraft voor, een uniform raamwerk dat afstand neemt
van eerdere modulaire pijplijnen en rigide, vooraf gedefinieerde lay-outs, waardoor het model
vrij kan experimenteren met samenhangende, visueel aantrekkelijke composities. PosterCraft maakt gebruik
van een zorgvuldig ontworpen, gecascadeerde workflow om het genereren van
hoogwaardige posters te optimaliseren: (i) grootschalige tekstweergave-optimalisatie op ons
nieuw geïntroduceerde Text-Render-2M-dataset; (ii) regio-gebaseerde supervised
fine-tuning op HQ-Poster100K; (iii) esthetische-tekst-versterkend leren via
best-of-n voorkeursoptimalisatie; en (iv) gezamenlijke visie-taal feedbackverfijning.
Elke fase wordt ondersteund door een volledig geautomatiseerde data-constructiepijplijn
die is afgestemd op de specifieke behoeften, waardoor robuuste training mogelijk is zonder
complexe architectuurwijzigingen. Uit evaluaties van meerdere experimenten blijkt
dat PosterCraft open-source basislijnen significant overtreft in weergavenauwkeurigheid,
lay-outcoherentie en algehele visuele aantrekkingskracht, waarbij het de kwaliteit
van SOTA commerciële systemen benadert. Onze code, modellen en datasets zijn te vinden op de
Projectpagina: https://ephemeral182.github.io/PosterCraft
English
Generating aesthetic posters is more challenging than simple design images:
it requires not only precise text rendering but also the seamless integration
of abstract artistic content, striking layouts, and overall stylistic harmony.
To address this, we propose PosterCraft, a unified framework that abandons
prior modular pipelines and rigid, predefined layouts, allowing the model to
freely explore coherent, visually compelling compositions. PosterCraft employs
a carefully designed, cascaded workflow to optimize the generation of
high-aesthetic posters: (i) large-scale text-rendering optimization on our
newly introduced Text-Render-2M dataset; (ii) region-aware supervised
fine-tuning on HQ-Poster100K; (iii) aesthetic-text-reinforcement learning via
best-of-n preference optimization; and (iv) joint vision-language feedback
refinement. Each stage is supported by a fully automated data-construction
pipeline tailored to its specific needs, enabling robust training without
complex architectural modifications. Evaluated on multiple experiments,
PosterCraft significantly outperforms open-source baselines in rendering
accuracy, layout coherence, and overall visual appeal-approaching the quality
of SOTA commercial systems. Our code, models, and datasets can be found in the
Project page: https://ephemeral182.github.io/PosterCraft