ChatPaper.aiChatPaper

논문 발표는 예술이다: 학술 발표를 위한 자기개발 미학 에이전트

Presenting a Paper is an Art: Self-Improvement Aesthetic Agents for Academic Presentations

October 7, 2025
저자: Chengzhi Liu, Yuzhe Yang, Kaiwen Zhou, Zhen Zhang, Yue Fan, Yannan Xie, Peng Qi, Xin Eric Wang
cs.AI

초록

학술 논문의 홍보는 연구 가시성을 높이는 중요한 수단이 되었습니다. 그러나 기존의 자동화된 방법들은 제한된 스토리텔링, 불충분한 미적 품질, 그리고 제약된 자기 조정 능력으로 인해 효율적이고 매력적인 전파를 달성하기 어려운 상황입니다. 이러한 도전 과제의 핵심에는 간단한 원칙이 있습니다: 올바르게 평가할 수 없다면 개선할 방법이 없습니다. 이를 해결하기 위해 우리는 EvoPresent를 소개합니다. 이는 일관된 내러티브, 미적 감각을 고려한 디자인, 그리고 가상 캐릭터를 통한 현실적인 발표 전달을 통합한 자기 개선 에이전트 프레임워크입니다. EvoPresent의 핵심은 PresAesth로, 다중 작업 강화 학습(RL) 미적 모델로서 신뢰할 수 있는 미적 점수, 결함 조정, 그리고 비교 피드백을 제공하여 제한된 미적 훈련 데이터 하에서도 반복적인 자기 개선을 가능하게 합니다. 이러한 방법을 체계적으로 평가하기 위해 우리는 EvoPresent 벤치마크를 도입했습니다. 이는 포괄적인 벤치마크로, 650편의 최상위 AI 컨퍼런스 논문과 멀티모달 리소스(슬라이드, 비디오, 스크립트)를 기반으로 한 발표 생성 품질 평가와, 다양한 미적 수준의 2,000쌍의 슬라이드로 구성된 미적 인식 평가를 포함하여 점수 매기기, 결함 조정, 그리고 비교에 대한 공동 훈련과 평가를 지원합니다. 우리의 연구 결과는 다음과 같은 점을 강조합니다: (i) 고품질의 피드백은 에이전트의 자기 개선에 필수적이며, 초기 능력만으로는 효과적인 자기 수정을 보장할 수 없습니다. (ii) 자동화된 생성 파이프라인은 시각적 디자인과 내용 구성 사이에서 트레이드오프를 보입니다. (iii) 다중 작업 RL 훈련은 미적 인식 작업에서 더 강력한 일반화 능력을 보여줍니다.
English
The promotion of academic papers has become an important means of enhancing research visibility. However, existing automated methods struggle limited storytelling, insufficient aesthetic quality, and constrained self-adjustment, making it difficult to achieve efficient and engaging dissemination. At the heart of those challenges is a simple principle: there is no way to improve it when you cannot evaluate it right. To address this, we introduce EvoPresent, a self-improvement agent framework that unifies coherent narratives, aesthetic-aware designs, and realistic presentation delivery via virtual characters. Central to EvoPresent is PresAesth, a multi-task reinforcement learning (RL) aesthetic model that provides reliable aesthetic scoring, defect adjustment, and comparative feedback, enabling iterative self-improvement even under limited aesthetic training data. To systematically evaluate the methods, we introduce EvoPresent Benchmark, a comprehensive benchmark comprising: Presentation Generation Quality, built on 650 top-tier AI conference papers with multimodal resources (slides, videos and scripts) to assess both content and design; and Aesthetic Awareness, consisting of 2,000 slide pairs with varying aesthetic levels, supporting joint training and evaluation on scoring, defect adjustment, and comparison. Our findings highlight that (i) High-quality feedback is essential for agent self-improvement, while initial capability alone does not guarantee effective self-correction. (ii) Automated generation pipelines exhibit a trade-off between visual design and content construction. (iii) Multi-task RL training shows stronger generalization in aesthetic awareness tasks.
PDF132October 8, 2025