Presentar un artículo es un arte: Agentes estéticos de superación personal para presentaciones académicas.
Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations
October 7, 2025
Autores: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI
Resumen
La promoción de artículos académicos se ha convertido en un medio importante para aumentar la visibilidad de la investigación. Sin embargo, los métodos automatizados existentes enfrentan limitaciones en la narrativa, calidad estética insuficiente y capacidad de autoajuste restringida, lo que dificulta lograr una difusión eficiente y atractiva. En el núcleo de estos desafíos se encuentra un principio simple: no es posible mejorar algo cuando no se puede evaluar correctamente. Para abordar esto, presentamos EvoPresent, un marco de agente de auto-mejora que unifica narrativas coherentes, diseños conscientes de la estética y presentaciones realistas a través de personajes virtuales. El elemento central de EvoPresent es PresAesth, un modelo estético de aprendizaje por refuerzo multitarea (RL) que proporciona puntuaciones estéticas confiables, ajuste de defectos y retroalimentación comparativa, permitiendo una auto-mejora iterativa incluso con datos limitados de entrenamiento estético. Para evaluar sistemáticamente los métodos, introducimos EvoPresent Benchmark, un punto de referencia integral que comprende: Calidad de Generación de Presentaciones, basado en 650 artículos de conferencias de IA de primer nivel con recursos multimodales (diapositivas, videos y guiones) para evaluar tanto el contenido como el diseño; y Conciencia Estética, que consiste en 2,000 pares de diapositivas con niveles estéticos variables, apoyando el entrenamiento y evaluación conjunta en puntuación, ajuste de defectos y comparación. Nuestros hallazgos destacan que (i) La retroalimentación de alta calidad es esencial para la auto-mejora del agente, mientras que la capacidad inicial por sí sola no garantiza una autocorrección efectiva. (ii) Las pipelines de generación automatizada exhiben un equilibrio entre el diseño visual y la construcción de contenido. (iii) El entrenamiento multitarea RL muestra una mayor generalización en tareas de conciencia estética.
English
The promotion of academic papers has become an important means of enhancing
research visibility. However, existing automated methods struggle limited
storytelling, insufficient aesthetic quality, and constrained self-adjustment,
making it difficult to achieve efficient and engaging dissemination. At the
heart of those challenges is a simple principle: there is no way to
improve it when you cannot evaluate it right. To address this, we introduce
EvoPresent, a self-improvement agent framework that unifies coherent
narratives, aesthetic-aware designs, and realistic presentation delivery via
virtual characters. Central to EvoPresent is PresAesth, a multi-task
reinforcement learning (RL) aesthetic model that provides reliable aesthetic
scoring, defect adjustment, and comparative feedback, enabling iterative
self-improvement even under limited aesthetic training data. To systematically
evaluate the methods, we introduce EvoPresent Benchmark, a
comprehensive benchmark comprising: Presentation Generation Quality,
built on 650 top-tier AI conference papers with multimodal resources (slides,
videos and scripts) to assess both content and design; and Aesthetic
Awareness, consisting of 2,000 slide pairs with varying aesthetic levels,
supporting joint training and evaluation on scoring, defect adjustment, and
comparison. Our findings highlight that (i) High-quality feedback is essential
for agent self-improvement, while initial capability alone does not guarantee
effective self-correction. (ii) Automated generation pipelines exhibit a
trade-off between visual design and content construction. (iii) Multi-task RL
training shows stronger generalization in aesthetic awareness tasks.