ChatPaper.aiChatPaper

Presentare un articolo è un'arte: Agenti estetici di auto-miglioramento per presentazioni accademiche

Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations

October 7, 2025
Autori: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI

Abstract

La promozione di articoli accademici è diventata un mezzo importante per aumentare la visibilità della ricerca. Tuttavia, i metodi automatizzati esistenti presentano limitazioni nella narrazione, una qualità estetica insufficiente e una capacità di autoregolazione limitata, rendendo difficile ottenere una diffusione efficiente e coinvolgente. Al centro di queste sfide c'è un principio semplice: non è possibile migliorare qualcosa quando non si è in grado di valutarla correttamente. Per affrontare questo problema, introduciamo EvoPresent, un framework di agenti di auto-miglioramento che unisce narrazioni coerenti, design consapevoli dell'estetica e presentazioni realistiche tramite personaggi virtuali. Cuore di EvoPresent è PresAesth, un modello estetico di apprendimento per rinforzo multi-task (RL) che fornisce valutazioni estetiche affidabili, regolazione dei difetti e feedback comparativo, consentendo un auto-miglioramento iterativo anche con dati di training estetico limitati. Per valutare sistematicamente i metodi, introduciamo EvoPresent Benchmark, un benchmark completo che comprende: Qualità della Generazione di Presentazioni, basato su 650 articoli di conferenze AI di alto livello con risorse multimodali (slide, video e script) per valutare sia il contenuto che il design; e Consapevolezza Estetica, composta da 2.000 coppie di slide con diversi livelli estetici, supportando l'addestramento e la valutazione congiunta su punteggio, regolazione dei difetti e confronto. I nostri risultati evidenziano che (i) Un feedback di alta qualità è essenziale per l'auto-miglioramento degli agenti, mentre la capacità iniziale da sola non garantisce una correzione efficace. (ii) Le pipeline di generazione automatizzata mostrano un compromesso tra design visivo e costruzione del contenuto. (iii) L'addestramento RL multi-task mostra una generalizzazione più forte nei compiti di consapevolezza estetica.
English
The promotion of academic papers has become an important means of enhancing research visibility. However, existing automated methods struggle limited storytelling, insufficient aesthetic quality, and constrained self-adjustment, making it difficult to achieve efficient and engaging dissemination. At the heart of those challenges is a simple principle: there is no way to improve it when you cannot evaluate it right. To address this, we introduce EvoPresent, a self-improvement agent framework that unifies coherent narratives, aesthetic-aware designs, and realistic presentation delivery via virtual characters. Central to EvoPresent is PresAesth, a multi-task reinforcement learning (RL) aesthetic model that provides reliable aesthetic scoring, defect adjustment, and comparative feedback, enabling iterative self-improvement even under limited aesthetic training data. To systematically evaluate the methods, we introduce EvoPresent Benchmark, a comprehensive benchmark comprising: Presentation Generation Quality, built on 650 top-tier AI conference papers with multimodal resources (slides, videos and scripts) to assess both content and design; and Aesthetic Awareness, consisting of 2,000 slide pairs with varying aesthetic levels, supporting joint training and evaluation on scoring, defect adjustment, and comparison. Our findings highlight that (i) High-quality feedback is essential for agent self-improvement, while initial capability alone does not guarantee effective self-correction. (ii) Automated generation pipelines exhibit a trade-off between visual design and content construction. (iii) Multi-task RL training shows stronger generalization in aesthetic awareness tasks.
PDF132October 8, 2025