DeepPresenter: エージェント型プレゼンテーション生成のための環境に根差したリフレクション
DeepPresenter: Environment-Grounded Reflection for Agentic Presentation Generation
February 26, 2026
著者: Hao Zheng, Guozhao Mo, Xinru Yan, Qianhao Yuan, Wenkai Zhang, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun
cs.AI
要旨
プレゼンテーション生成には、深い内容のリサーチ、一貫性のある視覚デザイン、観察に基づく反復的な改良が要求される。しかし、既存のプレゼンテーション生成エージェントは、事前に定義されたワークフローや固定テンプレートに依存することが多い。この問題に対処するため、我々はDeepPresenterを提案する。これは、多様なユーザー意図に適応し、効果的なフィードバック駆動の改良を可能にし、スクリプト化されたパイプラインを超えて一般化するエージェントフレームワークである。具体的には、DeepPresenterは、環境観察を用いた長期的な改良を支援するため、中間スライド成果物を自律的に計画、レンダリング、修正する。さらに、内部信号(例:推論トレース)に対する自己内省に依存するのではなく、我々の環境に根ざしたリフレクションは、知覚可能な成果物の状態(例:レンダリングされたスライド)に生成プロセスを条件付け、実行中にプレゼンテーション特有の問題を特定し修正することを可能にする。多様なプレゼンテーション生成シナリオを網羅する評価セットにおける結果は、DeepPresenterが最先端の性能を達成し、ファインチューニングされた9Bモデルが大幅に低コストで高い競争力を維持することを示している。本プロジェクトは以下で公開されている: https://github.com/icip-cas/PPTAgent
English
Presentation generation requires deep content research, coherent visual design, and iterative refinement based on observation. However, existing presentation agents often rely on predefined workflows and fixed templates. To address this, we present DeepPresenter, an agentic framework that adapts to diverse user intents, enables effective feedback-driven refinement, and generalizes beyond a scripted pipeline. Specifically, DeepPresenter autonomously plans, renders, and revises intermediate slide artifacts to support long-horizon refinement with environmental observations. Furthermore, rather than relying on self-reflection over internal signals (e.g., reasoning traces), our environment-grounded reflection conditions the generation process on perceptual artifact states (e.g., rendered slides), enabling the system to identify and correct presentation-specific issues during execution. Results on the evaluation set covering diverse presentation-generation scenarios show that DeepPresenter achieves state-of-the-art performance, and the fine-tuned 9B model remains highly competitive at substantially lower cost. Our project is available at: https://github.com/icip-cas/PPTAgent