ChatPaper.aiChatPaper

Présenter un article est un art : agents esthétiques d’auto-amélioration pour les présentations académiques

Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations

October 7, 2025
papers.authors: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI

papers.abstract

La promotion des articles académiques est devenue un moyen essentiel pour accroître la visibilité des recherches. Cependant, les méthodes automatisées existantes peinent à offrir une narration cohérente, une qualité esthétique insuffisante et une capacité d'auto-ajustement limitée, rendant difficile une diffusion efficace et engageante. Au cœur de ces défis se trouve un principe simple : il est impossible de s’améliorer sans une évaluation adéquate. Pour répondre à cela, nous présentons EvoPresent, un cadre d’agent d’auto-amélioration qui unifie des récits cohérents, des designs sensibles à l’esthétique et une présentation réaliste via des personnages virtuels. Au centre d’EvoPresent se trouve PresAesth, un modèle esthétique d’apprentissage par renforcement multi-tâches (RL) qui fournit une notation esthétique fiable, un ajustement des défauts et un retour comparatif, permettant une auto-amélioration itérative même avec des données d’entraînement esthétiques limitées. Pour évaluer systématiquement les méthodes, nous introduisons EvoPresent Benchmark, un benchmark complet comprenant : la Qualité de Génération de Présentation, basée sur 650 articles de conférences IA de premier plan avec des ressources multimodales (diapositives, vidéos et scripts) pour évaluer à la fois le contenu et le design ; et la Sensibilité Esthétique, composée de 2 000 paires de diapositives avec des niveaux esthétiques variés, soutenant l’entraînement et l’évaluation conjoints sur la notation, l’ajustement des défauts et la comparaison. Nos résultats mettent en évidence que (i) Un retour de haute qualité est essentiel pour l’auto-amélioration de l’agent, tandis que la capacité initiale seule ne garantit pas une auto-correction efficace. (ii) Les pipelines de génération automatisée présentent un compromis entre le design visuel et la construction du contenu. (iii) L’entraînement RL multi-tâches montre une meilleure généralisation dans les tâches de sensibilité esthétique.
English
The promotion of academic papers has become an important means of enhancing research visibility. However, existing automated methods struggle limited storytelling, insufficient aesthetic quality, and constrained self-adjustment, making it difficult to achieve efficient and engaging dissemination. At the heart of those challenges is a simple principle: there is no way to improve it when you cannot evaluate it right. To address this, we introduce EvoPresent, a self-improvement agent framework that unifies coherent narratives, aesthetic-aware designs, and realistic presentation delivery via virtual characters. Central to EvoPresent is PresAesth, a multi-task reinforcement learning (RL) aesthetic model that provides reliable aesthetic scoring, defect adjustment, and comparative feedback, enabling iterative self-improvement even under limited aesthetic training data. To systematically evaluate the methods, we introduce EvoPresent Benchmark, a comprehensive benchmark comprising: Presentation Generation Quality, built on 650 top-tier AI conference papers with multimodal resources (slides, videos and scripts) to assess both content and design; and Aesthetic Awareness, consisting of 2,000 slide pairs with varying aesthetic levels, supporting joint training and evaluation on scoring, defect adjustment, and comparison. Our findings highlight that (i) High-quality feedback is essential for agent self-improvement, while initial capability alone does not guarantee effective self-correction. (ii) Automated generation pipelines exhibit a trade-off between visual design and content construction. (iii) Multi-task RL training shows stronger generalization in aesthetic awareness tasks.
PDF132October 8, 2025