ChatPaper.aiChatPaper

Apresentar um Artigo é uma Arte: Agentes Estéticos de Autodesenvolvimento para Apresentações Acadêmicas

Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations

October 7, 2025
Autores: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI

Resumo

A promoção de artigos acadêmicos tornou-se um meio importante para aumentar a visibilidade da pesquisa. No entanto, os métodos automatizados existentes enfrentam desafios como narrativas limitadas, qualidade estética insuficiente e capacidade de autoajuste restrita, dificultando a disseminação eficiente e envolvente. No cerne desses desafios está um princípio simples: não há como melhorar algo quando não é possível avaliá-lo corretamente. Para resolver isso, apresentamos o EvoPresent, uma estrutura de agente de autoaperfeiçoamento que unifica narrativas coerentes, designs conscientes da estética e entrega realista de apresentações por meio de personagens virtuais. O núcleo do EvoPresent é o PresAesth, um modelo estético de aprendizado por reforço multitarefa (RL) que fornece pontuação estética confiável, ajuste de defeitos e feedback comparativo, permitindo o autoaperfeiçoamento iterativo mesmo com dados limitados de treinamento estético. Para avaliar os métodos de forma sistemática, introduzimos o EvoPresent Benchmark, um benchmark abrangente que compreende: Qualidade de Geração de Apresentação, baseado em 650 artigos de conferências de IA de alto nível com recursos multimodais (slides, vídeos e scripts) para avaliar tanto o conteúdo quanto o design; e Consciência Estética, composta por 2.000 pares de slides com níveis estéticos variados, apoiando o treinamento e avaliação conjuntos em pontuação, ajuste de defeitos e comparação. Nossas descobertas destacam que (i) Feedback de alta qualidade é essencial para o autoaperfeiçoamento do agente, enquanto a capacidade inicial por si só não garante uma autocorreção eficaz. (ii) Pipelines de geração automatizada exibem uma troca entre design visual e construção de conteúdo. (iii) O treinamento multitarefa com RL mostra maior generalização em tarefas de consciência estética.
English
The promotion of academic papers has become an important means of enhancing research visibility. However, existing automated methods struggle limited storytelling, insufficient aesthetic quality, and constrained self-adjustment, making it difficult to achieve efficient and engaging dissemination. At the heart of those challenges is a simple principle: there is no way to improve it when you cannot evaluate it right. To address this, we introduce EvoPresent, a self-improvement agent framework that unifies coherent narratives, aesthetic-aware designs, and realistic presentation delivery via virtual characters. Central to EvoPresent is PresAesth, a multi-task reinforcement learning (RL) aesthetic model that provides reliable aesthetic scoring, defect adjustment, and comparative feedback, enabling iterative self-improvement even under limited aesthetic training data. To systematically evaluate the methods, we introduce EvoPresent Benchmark, a comprehensive benchmark comprising: Presentation Generation Quality, built on 650 top-tier AI conference papers with multimodal resources (slides, videos and scripts) to assess both content and design; and Aesthetic Awareness, consisting of 2,000 slide pairs with varying aesthetic levels, supporting joint training and evaluation on scoring, defect adjustment, and comparison. Our findings highlight that (i) High-quality feedback is essential for agent self-improvement, while initial capability alone does not guarantee effective self-correction. (ii) Automated generation pipelines exhibit a trade-off between visual design and content construction. (iii) Multi-task RL training shows stronger generalization in aesthetic awareness tasks.
PDF132October 8, 2025