DeepPresenter: Omgevingsgebaseerde reflectie voor het genereren van agent-ondersteunde presentaties
DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation
February 26, 2026
Auteurs: Hao Zheng, Guozhao Mo, Xinru Yan, Qianhao Yuan, Wenkai Zhang, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun
cs.AI
Samenvatting
Het genereren van presentaties vereist diepgaand inhoudelijk onderzoek, coherent visueel ontwerp en iteratieve verfijning op basis van observatie. Bestaande presentatie-agentschappen vertrouwen echter vaak op vooraf gedefinieerde workflows en vaste sjablonen. Om dit aan te pakken, presenteren wij DeepPresenter, een agent-gebaseerd framework dat zich aanpast aan diverse gebruikersintenties, effectieve feedback-gestuurde verfijning mogelijk maakt en generaliseert voorbij een gescripte pijplijn. Concreet plant, rendert en reviseert DeepPresenter autonoom tussenliggende slide-artefacten om langetermijnverfijning met omgevingsobservaties te ondersteunen. Bovendien, in plaats van te vertrouwen op zelfreflectie over interne signalen (zoals redeneersporen), grondt onze op de omgeving gebaseerde reflectie het generatieproces in waargenomen artefacttoestanden (zoals gerenderde slides), waardoor het systeem presentatiespecifieke problemen tijdens uitvoering kan identificeren en corrigeren. Resultaten op de evaluatieset, die diverse presentatiegeneratiescenario's dekt, tonen aan dat DeepPresenter state-of-the-art prestaties bereikt, en het fine-tuned 9B-model blijft zeer competitief tegen aanzienlijk lagere kosten. Ons project is beschikbaar op: https://github.com/icip-cas/PPTAgent
English
Presentation generation requires deep content research, coherent visual design, and iterative refinement based on observation. However, existing presentation agents often rely on predefined workflows and fixed templates. To address this, we present DeepPresenter, an agentic framework that adapts to diverse user intents, enables effective feedback-driven refinement, and generalizes beyond a scripted pipeline. Specifically, DeepPresenter autonomously plans, renders, and revises intermediate slide artifacts to support long-horizon refinement with environmental observations. Furthermore, rather than relying on self-reflection over internal signals (e.g., reasoning traces), our environment-grounded reflection conditions the generation process on perceptual artifact states (e.g., rendered slides), enabling the system to identify and correct presentation-specific issues during execution. Results on the evaluation set covering diverse presentation-generation scenarios show that DeepPresenter achieves state-of-the-art performance, and the fine-tuned 9B model remains highly competitive at substantially lower cost. Our project is available at: https://github.com/icip-cas/PPTAgent