Das Präsentieren eines Vortrags ist eine Kunst: Selbstverbesserungsästhetische Agenten für akademische Präsentationen
Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations
October 7, 2025
papers.authors: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI
papers.abstract
Die Förderung von wissenschaftlichen Arbeiten ist zu einem wichtigen Mittel zur Steigerung der Sichtbarkeit von Forschungsergebnissen geworden. Allerdings kämpfen bestehende automatisierte Methoden mit begrenzter Erzählfähigkeit, unzureichender ästhetischer Qualität und eingeschränkter Selbstanpassung, was eine effiziente und ansprechende Verbreitung erschwert. Im Kern dieser Herausforderungen liegt ein einfaches Prinzip: Es gibt keine Möglichkeit zur Verbesserung, wenn man es nicht richtig bewerten kann. Um dies zu adressieren, stellen wir EvoPresent vor, ein Rahmenwerk für selbstverbessernde Agenten, das kohärente Erzählungen, ästhetisch bewusste Designs und realistische Präsentationsdarbietungen durch virtuelle Charaktere vereint. Zentrale Komponente von EvoPresent ist PresAesth, ein Multi-Task-Reinforcement-Learning (RL)-Modell für Ästhetik, das zuverlässige ästhetische Bewertungen, Defektanpassungen und vergleichende Rückmeldungen bietet und so iterative Selbstverbesserung auch bei begrenzten ästhetischen Trainingsdaten ermöglicht. Um die Methoden systematisch zu evaluieren, führen wir den EvoPresent Benchmark ein, einen umfassenden Benchmark, der Folgendes umfasst: Präsentationsgenerierungsqualität, basierend auf 650 hochrangigen KI-Konferenzpapieren mit multimodalen Ressourcen (Folien, Videos und Skripte), um sowohl Inhalt als auch Design zu bewerten; und ästhetisches Bewusstsein, bestehend aus 2.000 Folienpaaren mit unterschiedlichen ästhetischen Niveaus, das gemeinsames Training und Bewertung in Bezug auf Bewertung, Defektanpassung und Vergleich unterstützt. Unsere Ergebnisse zeigen, dass (i) hochwertige Rückmeldungen für die Selbstverbesserung von Agenten entscheidend sind, während die anfängliche Fähigkeit allein keine effektive Selbstkorrektur garantiert. (ii) Automatisierte Generierungspipelines zeigen einen Kompromiss zwischen visuellem Design und Inhaltskonstruktion. (iii) Multi-Task-RL-Training zeigt eine stärkere Generalisierung in Aufgaben des ästhetischen Bewusstseins.
English
The promotion of academic papers has become an important means of enhancing
research visibility. However, existing automated methods struggle limited
storytelling, insufficient aesthetic quality, and constrained self-adjustment,
making it difficult to achieve efficient and engaging dissemination. At the
heart of those challenges is a simple principle: there is no way to
improve it when you cannot evaluate it right. To address this, we introduce
EvoPresent, a self-improvement agent framework that unifies coherent
narratives, aesthetic-aware designs, and realistic presentation delivery via
virtual characters. Central to EvoPresent is PresAesth, a multi-task
reinforcement learning (RL) aesthetic model that provides reliable aesthetic
scoring, defect adjustment, and comparative feedback, enabling iterative
self-improvement even under limited aesthetic training data. To systematically
evaluate the methods, we introduce EvoPresent Benchmark, a
comprehensive benchmark comprising: Presentation Generation Quality,
built on 650 top-tier AI conference papers with multimodal resources (slides,
videos and scripts) to assess both content and design; and Aesthetic
Awareness, consisting of 2,000 slide pairs with varying aesthetic levels,
supporting joint training and evaluation on scoring, defect adjustment, and
comparison. Our findings highlight that (i) High-quality feedback is essential
for agent self-improvement, while initial capability alone does not guarantee
effective self-correction. (ii) Automated generation pipelines exhibit a
trade-off between visual design and content construction. (iii) Multi-task RL
training shows stronger generalization in aesthetic awareness tasks.