Een Paper Presenteren is een Kunst: Zelfverbeterende Esthetische Agentschappen voor Academische Presentaties
Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations
October 7, 2025
Auteurs: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI
Samenvatting
De promotie van academische artikelen is een belangrijk middel geworden om de zichtbaarheid van onderzoek te vergroten. Bestaande geautomatiseerde methoden kampen echter met beperkte vertelkwaliteit, onvoldoende esthetische kwaliteit en beperkte zelfaanpassing, waardoor het moeilijk is om een efficiënte en boeiende verspreiding te bereiken. Centraal in deze uitdagingen ligt een eenvoudig principe: er is geen manier om iets te verbeteren als je het niet goed kunt evalueren. Om dit aan te pakken, introduceren we EvoPresent, een raamwerk voor zelfverbeterende agents dat coherente verhalen, esthetisch bewuste ontwerpen en realistische presentatielevering via virtuele personages verenigt. Kern van EvoPresent is PresAesth, een multi-task reinforcement learning (RL) esthetisch model dat betrouwbare esthetische scoring, defectaanpassing en vergelijkende feedback biedt, waardoor iteratieve zelfverbetering mogelijk is, zelfs bij beperkte esthetische trainingsdata. Om de methoden systematisch te evalueren, introduceren we de EvoPresent Benchmark, een uitgebreide benchmark bestaande uit: Presentatie Generatie Kwaliteit, gebaseerd op 650 top AI-conferentiepapers met multimodale bronnen (slides, video's en scripts) om zowel inhoud als ontwerp te beoordelen; en Esthetisch Bewustzijn, bestaande uit 2.000 slideparen met verschillende esthetische niveaus, die gezamenlijke training en evaluatie ondersteunen op scoring, defectaanpassing en vergelijking. Onze bevindingen benadrukken dat (i) hoogwaardige feedback essentieel is voor zelfverbetering van agents, terwijl initiële capaciteit alleen geen effectieve zelfcorrectie garandeert. (ii) Geautomatiseerde generatiepijplijnen vertonen een afweging tussen visueel ontwerp en inhoudsconstructie. (iii) Multi-task RL-training toont een sterkere generalisatie in esthetisch bewustzijnstaken.
English
The promotion of academic papers has become an important means of enhancing
research visibility. However, existing automated methods struggle limited
storytelling, insufficient aesthetic quality, and constrained self-adjustment,
making it difficult to achieve efficient and engaging dissemination. At the
heart of those challenges is a simple principle: there is no way to
improve it when you cannot evaluate it right. To address this, we introduce
EvoPresent, a self-improvement agent framework that unifies coherent
narratives, aesthetic-aware designs, and realistic presentation delivery via
virtual characters. Central to EvoPresent is PresAesth, a multi-task
reinforcement learning (RL) aesthetic model that provides reliable aesthetic
scoring, defect adjustment, and comparative feedback, enabling iterative
self-improvement even under limited aesthetic training data. To systematically
evaluate the methods, we introduce EvoPresent Benchmark, a
comprehensive benchmark comprising: Presentation Generation Quality,
built on 650 top-tier AI conference papers with multimodal resources (slides,
videos and scripts) to assess both content and design; and Aesthetic
Awareness, consisting of 2,000 slide pairs with varying aesthetic levels,
supporting joint training and evaluation on scoring, defect adjustment, and
comparison. Our findings highlight that (i) High-quality feedback is essential
for agent self-improvement, while initial capability alone does not guarantee
effective self-correction. (ii) Automated generation pipelines exhibit a
trade-off between visual design and content construction. (iii) Multi-task RL
training shows stronger generalization in aesthetic awareness tasks.