PosterGen : Génération de posters esthétiques à partir d'articles via des modèles de langage multi-agents
PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs
August 24, 2025
papers.authors: Zhilin Zhang, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Chenyu You
cs.AI
papers.abstract
Les systèmes multi-agents basés sur des modèles de langage de grande taille (LLMs) ont démontré des capacités remarquables pour résoudre des tâches compositionnelles complexes. Dans ce travail, nous appliquons ce paradigme au problème de génération de posters à partir d'articles, un processus pratique mais chronophage auquel sont confrontés les chercheurs préparant des conférences. Bien que des approches récentes aient tenté d'automatiser cette tâche, la plupart négligent les principes fondamentaux de conception et d'esthétique, ce qui entraîne des posters nécessitant un raffinement manuel important. Pour pallier ces limitations de conception, nous proposons PosterGen, un cadre multi-agent qui reproduit le flux de travail des concepteurs de posters professionnels. Il se compose de quatre agents spécialisés collaboratifs : (1) les agents Parser et Curator extraient le contenu de l'article et organisent le storyboard ; (2) l'agent Layout structure le contenu dans une disposition spatiale cohérente ; (3) les agents Stylist appliquent des éléments de design visuel tels que la couleur et la typographie ; et (4) le Renderer compose le poster final. Ensemble, ces agents produisent des posters à la fois sémantiquement pertinents et visuellement attrayants. Pour évaluer la qualité de la conception, nous introduisons une grille d'évaluation basée sur un modèle vision-langage (VLM) qui mesure l'équilibre de la mise en page, la lisibilité et la cohérence esthétique. Les résultats expérimentaux montrent que PosterGen correspond systématiquement en termes de fidélité du contenu et surpasse significativement les méthodes existantes en matière de design visuel, générant des posters prêts à être présentés avec un minimum de retouches manuelles.
English
Multi-agent systems built upon large language models (LLMs) have demonstrated
remarkable capabilities in tackling complex compositional tasks. In this work,
we apply this paradigm to the paper-to-poster generation problem, a practical
yet time-consuming process faced by researchers preparing for conferences.
While recent approaches have attempted to automate this task, most neglect core
design and aesthetic principles, resulting in posters that require substantial
manual refinement. To address these design limitations, we propose PosterGen, a
multi-agent framework that mirrors the workflow of professional poster
designers. It consists of four collaborative specialized agents: (1) Parser and
Curator agents extract content from the paper and organize storyboard; (2)
Layout agent maps the content into a coherent spatial layout; (3) Stylist
agents apply visual design elements such as color and typography; and (4)
Renderer composes the final poster. Together, these agents produce posters that
are both semantically grounded and visually appealing. To evaluate design
quality, we introduce a vision-language model (VLM)-based rubric that measures
layout balance, readability, and aesthetic coherence. Experimental results show
that PosterGen consistently matches in content fidelity, and significantly
outperforms existing methods in visual designs, generating posters that are
presentation-ready with minimal human refinements.