ChatPaper.aiChatPaper

DeepPresenter: Среда для формирования рефлексии при генерации презентаций с помощью агентов

DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation

February 26, 2026
Авторы: Hao Zheng, Guozhao Mo, Xinru Yan, Qianhao Yuan, Wenkai Zhang, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun
cs.AI

Аннотация

Создание презентаций требует глубокого исследования содержания, последовательного визуального дизайна и итеративного уточнения на основе наблюдений. Однако существующие системы автоматизации презентаций часто полагаются на предопределенные рабочие процессы и фиксированные шаблоны. Для решения этой проблемы мы представляем DeepPresenter — агентный фреймворк, который адаптируется к разнообразным пользовательским интенциям, обеспечивает эффективное уточнение на основе обратной связи и обобщает подход за пределы скриптового пайплайна. В частности, DeepPresenter автономно планирует, визуализирует и корректирует промежуточные артефакты слайдов для поддержки долгосрочного уточнения с учетом наблюдений за средой. Более того, вместо саморефлексии над внутренними сигналами (например, трассировкой рассуждений), наша рефлексия, основанная на среде, обусловливает процесс генерации состояниями перцептивных артефактов (например, визуализированных слайдов), что позволяет системе выявлять и исправлять специфические для презентаций проблемы во время выполнения. Результаты на оценочном наборе данных, охватывающем различные сценарии генерации презентаций, показывают, что DeepPresenter демонстрирует наилучшую производительность, а дообученная 9-миллиардная модель остается высококонкурентной при существенно более низкой стоимости. Наш проект доступен по адресу: https://github.com/icip-cas/PPTAgent
English
Presentation generation requires deep content research, coherent visual design, and iterative refinement based on observation. However, existing presentation agents often rely on predefined workflows and fixed templates. To address this, we present DeepPresenter, an agentic framework that adapts to diverse user intents, enables effective feedback-driven refinement, and generalizes beyond a scripted pipeline. Specifically, DeepPresenter autonomously plans, renders, and revises intermediate slide artifacts to support long-horizon refinement with environmental observations. Furthermore, rather than relying on self-reflection over internal signals (e.g., reasoning traces), our environment-grounded reflection conditions the generation process on perceptual artifact states (e.g., rendered slides), enabling the system to identify and correct presentation-specific issues during execution. Results on the evaluation set covering diverse presentation-generation scenarios show that DeepPresenter achieves state-of-the-art performance, and the fine-tuned 9B model remains highly competitive at substantially lower cost. Our project is available at: https://github.com/icip-cas/PPTAgent
PDF32May 8, 2026