ChatPaper.aiChatPaper

PosterGen : Génération de posters esthétiques à partir d'articles via des modèles de langage multi-agents

PosterGen: Aesthetic-Aware Paper-to-Poster Generation via Multi-Agent LLMs

August 24, 2025
papers.authors: Zhilin Zhang, Xiang Zhang, Jiaqi Wei, Yiwei Xu, Chenyu You
cs.AI

papers.abstract

Les systèmes multi-agents basés sur des modèles de langage de grande taille (LLMs) ont démontré des capacités remarquables pour résoudre des tâches compositionnelles complexes. Dans ce travail, nous appliquons ce paradigme au problème de génération de posters à partir d'articles, un processus pratique mais chronophage auquel sont confrontés les chercheurs préparant des conférences. Bien que des approches récentes aient tenté d'automatiser cette tâche, la plupart négligent les principes fondamentaux de conception et d'esthétique, ce qui entraîne des posters nécessitant un raffinement manuel important. Pour pallier ces limitations de conception, nous proposons PosterGen, un cadre multi-agent qui reproduit le flux de travail des concepteurs de posters professionnels. Il se compose de quatre agents spécialisés collaboratifs : (1) les agents Parser et Curator extraient le contenu de l'article et organisent le storyboard ; (2) l'agent Layout structure le contenu dans une disposition spatiale cohérente ; (3) les agents Stylist appliquent des éléments de design visuel tels que la couleur et la typographie ; et (4) le Renderer compose le poster final. Ensemble, ces agents produisent des posters à la fois sémantiquement pertinents et visuellement attrayants. Pour évaluer la qualité de la conception, nous introduisons une grille d'évaluation basée sur un modèle vision-langage (VLM) qui mesure l'équilibre de la mise en page, la lisibilité et la cohérence esthétique. Les résultats expérimentaux montrent que PosterGen correspond systématiquement en termes de fidélité du contenu et surpasse significativement les méthodes existantes en matière de design visuel, générant des posters prêts à être présentés avec un minimum de retouches manuelles.
English
Multi-agent systems built upon large language models (LLMs) have demonstrated remarkable capabilities in tackling complex compositional tasks. In this work, we apply this paradigm to the paper-to-poster generation problem, a practical yet time-consuming process faced by researchers preparing for conferences. While recent approaches have attempted to automate this task, most neglect core design and aesthetic principles, resulting in posters that require substantial manual refinement. To address these design limitations, we propose PosterGen, a multi-agent framework that mirrors the workflow of professional poster designers. It consists of four collaborative specialized agents: (1) Parser and Curator agents extract content from the paper and organize storyboard; (2) Layout agent maps the content into a coherent spatial layout; (3) Stylist agents apply visual design elements such as color and typography; and (4) Renderer composes the final poster. Together, these agents produce posters that are both semantically grounded and visually appealing. To evaluate design quality, we introduce a vision-language model (VLM)-based rubric that measures layout balance, readability, and aesthetic coherence. Experimental results show that PosterGen consistently matches in content fidelity, and significantly outperforms existing methods in visual designs, generating posters that are presentation-ready with minimal human refinements.
PDF92August 26, 2025