Das Präsentieren eines Vortrags ist eine Kunst: Selbstverbesserungsästhetische Agenten für akademische Präsentationen

papers.abstract

Die Förderung von wissenschaftlichen Arbeiten ist zu einem wichtigen Mittel zur Steigerung der Sichtbarkeit von Forschungsergebnissen geworden. Allerdings kämpfen bestehende automatisierte Methoden mit begrenzter Erzählfähigkeit, unzureichender ästhetischer Qualität und eingeschränkter Selbstanpassung, was eine effiziente und ansprechende Verbreitung erschwert. Im Kern dieser Herausforderungen liegt ein einfaches Prinzip: Es gibt keine Möglichkeit zur Verbesserung, wenn man es nicht richtig bewerten kann. Um dies zu adressieren, stellen wir EvoPresent vor, ein Rahmenwerk für selbstverbessernde Agenten, das kohärente Erzählungen, ästhetisch bewusste Designs und realistische Präsentationsdarbietungen durch virtuelle Charaktere vereint. Zentrale Komponente von EvoPresent ist PresAesth, ein Multi-Task-Reinforcement-Learning (RL)-Modell für Ästhetik, das zuverlässige ästhetische Bewertungen, Defektanpassungen und vergleichende Rückmeldungen bietet und so iterative Selbstverbesserung auch bei begrenzten ästhetischen Trainingsdaten ermöglicht. Um die Methoden systematisch zu evaluieren, führen wir den EvoPresent Benchmark ein, einen umfassenden Benchmark, der Folgendes umfasst: Präsentationsgenerierungsqualität, basierend auf 650 hochrangigen KI-Konferenzpapieren mit multimodalen Ressourcen (Folien, Videos und Skripte), um sowohl Inhalt als auch Design zu bewerten; und ästhetisches Bewusstsein, bestehend aus 2.000 Folienpaaren mit unterschiedlichen ästhetischen Niveaus, das gemeinsames Training und Bewertung in Bezug auf Bewertung, Defektanpassung und Vergleich unterstützt. Unsere Ergebnisse zeigen, dass (i) hochwertige Rückmeldungen für die Selbstverbesserung von Agenten entscheidend sind, während die anfängliche Fähigkeit allein keine effektive Selbstkorrektur garantiert. (ii) Automatisierte Generierungspipelines zeigen einen Kompromiss zwischen visuellem Design und Inhaltskonstruktion. (iii) Multi-Task-RL-Training zeigt eine stärkere Generalisierung in Aufgaben des ästhetischen Bewusstseins.

English

The promotion of academic papers has become an important means of enhancing research visibility. However, existing automated methods struggle limited storytelling, insufficient aesthetic quality, and constrained self-adjustment, making it difficult to achieve efficient and engaging dissemination. At the heart of those challenges is a simple principle: there is no way to improve it when you cannot evaluate it right. To address this, we introduce EvoPresent, a self-improvement agent framework that unifies coherent narratives, aesthetic-aware designs, and realistic presentation delivery via virtual characters. Central to EvoPresent is PresAesth, a multi-task reinforcement learning (RL) aesthetic model that provides reliable aesthetic scoring, defect adjustment, and comparative feedback, enabling iterative self-improvement even under limited aesthetic training data. To systematically evaluate the methods, we introduce EvoPresent Benchmark, a comprehensive benchmark comprising: Presentation Generation Quality, built on 650 top-tier AI conference papers with multimodal resources (slides, videos and scripts) to assess both content and design; and Aesthetic Awareness, consisting of 2,000 slide pairs with varying aesthetic levels, supporting joint training and evaluation on scoring, defect adjustment, and comparison. Our findings highlight that (i) High-quality feedback is essential for agent self-improvement, while initial capability alone does not guarantee effective self-correction. (ii) Automated generation pipelines exhibit a trade-off between visual design and content construction. (iii) Multi-task RL training shows stronger generalization in aesthetic awareness tasks.

Das Präsentieren eines Vortrags ist eine Kunst: Selbstverbesserungsästhetische Agenten für akademische Präsentationen

Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations

papers.abstract

Support