ChatPaper.aiChatPaper

PosterCraft: Een nieuwe benadering voor het genereren van hoogwaardige esthetische posters binnen een geïntegreerd raamwerk

PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework

June 12, 2025
Auteurs: SiXiang Chen, Jianyu Lai, Jialin Gao, Tian Ye, Haoyu Chen, Hengyu Shi, Shitong Shao, Yunlong Lin, Song Fei, Zhaohu Xing, Yeying Jin, Junfeng Luo, Xiaoming Wei, Lei Zhu
cs.AI

Samenvatting

Het genereren van esthetische posters is uitdagender dan het maken van eenvoudige ontwerpafbeeldingen: het vereist niet alleen nauwkeurige tekstweergave, maar ook de naadloze integratie van abstracte artistieke inhoud, opvallende lay-outs en algehele stilistische harmonie. Om dit aan te pakken, stellen we PosterCraft voor, een uniform raamwerk dat afstand neemt van eerdere modulaire pijplijnen en rigide, vooraf gedefinieerde lay-outs, waardoor het model vrij kan experimenteren met samenhangende, visueel aantrekkelijke composities. PosterCraft maakt gebruik van een zorgvuldig ontworpen, gecascadeerde workflow om het genereren van hoogwaardige posters te optimaliseren: (i) grootschalige tekstweergave-optimalisatie op ons nieuw geïntroduceerde Text-Render-2M-dataset; (ii) regio-gebaseerde supervised fine-tuning op HQ-Poster100K; (iii) esthetische-tekst-versterkend leren via best-of-n voorkeursoptimalisatie; en (iv) gezamenlijke visie-taal feedbackverfijning. Elke fase wordt ondersteund door een volledig geautomatiseerde data-constructiepijplijn die is afgestemd op de specifieke behoeften, waardoor robuuste training mogelijk is zonder complexe architectuurwijzigingen. Uit evaluaties van meerdere experimenten blijkt dat PosterCraft open-source basislijnen significant overtreft in weergavenauwkeurigheid, lay-outcoherentie en algehele visuele aantrekkingskracht, waarbij het de kwaliteit van SOTA commerciële systemen benadert. Onze code, modellen en datasets zijn te vinden op de Projectpagina: https://ephemeral182.github.io/PosterCraft
English
Generating aesthetic posters is more challenging than simple design images: it requires not only precise text rendering but also the seamless integration of abstract artistic content, striking layouts, and overall stylistic harmony. To address this, we propose PosterCraft, a unified framework that abandons prior modular pipelines and rigid, predefined layouts, allowing the model to freely explore coherent, visually compelling compositions. PosterCraft employs a carefully designed, cascaded workflow to optimize the generation of high-aesthetic posters: (i) large-scale text-rendering optimization on our newly introduced Text-Render-2M dataset; (ii) region-aware supervised fine-tuning on HQ-Poster100K; (iii) aesthetic-text-reinforcement learning via best-of-n preference optimization; and (iv) joint vision-language feedback refinement. Each stage is supported by a fully automated data-construction pipeline tailored to its specific needs, enabling robust training without complex architectural modifications. Evaluated on multiple experiments, PosterCraft significantly outperforms open-source baselines in rendering accuracy, layout coherence, and overall visual appeal-approaching the quality of SOTA commercial systems. Our code, models, and datasets can be found in the Project page: https://ephemeral182.github.io/PosterCraft
PDF193June 13, 2025