ChatPaper.aiChatPaper

SlideTailor:科学論文向け個別化プレゼンテーションスライド生成システム

SlideTailor: Personalized Presentation Slide Generation for Scientific Papers

December 23, 2025
著者: Wenzheng Zeng, Mingyu Ouyang, Langyuan Cui, Hwee Tou Ng
cs.AI

要旨

自動的なプレゼンテーションスライド生成は、コンテンツ作成を大幅に効率化できる可能性を秘めています。しかし、ユーザーごとに好みが異なるため、既存の過少指定された定式化では、個々のユーザーのニーズに合わない最適ではない結果が生じがちです。本研究では、論文からスライドへの生成をユーザー指定の好みに条件づける新規タスクを提案します。我々は、人間の行動にヒントを得たエージェント型フレームワークであるSlideTailorを提案します。このフレームワークは、ユーザーに沿った方法で編集可能なスライドを段階的に生成します。ユーザーに詳細なテキスト形式での好みの記入を求める代わりに、本システムは論文とスライドの事例ペアとビジュアルテンプレートのみを要求します。これらは、コンテンツと視覚スタイルにわたる豊富なユーザー選好を暗黙的にコード化した、自然で提供しやすい成果物です。これらの入力が暗黙的かつラベル付けされていないにもかかわらず、本フレームワークは選好を効果的に抽出・一般化し、カスタマイズされたスライド生成を導きます。さらに、スライド内容を計画された口頭説明に整合させるための新規なチェーン・オブ・スピーチ機構を導入します。この設計は、生成されるスライドの品質を大幅に向上させ、ビデオプレゼンテーションのような下流アプリケーションを可能にします。この新規タスクを支援するため、多様なユーザー選好を捉えたベンチマークデータセットを構築し、堅牢な評価のための注意深く設計された解釈可能な指標を設けました。大規模な実験により、本フレームワークの有効性が実証されています。
English
Automatic presentation slide generation can greatly streamline content creation. However, since preferences of each user may vary, existing under-specified formulations often lead to suboptimal results that fail to align with individual user needs. We introduce a novel task that conditions paper-to-slides generation on user-specified preferences. We propose a human behavior-inspired agentic framework, SlideTailor, that progressively generates editable slides in a user-aligned manner. Instead of requiring users to write their preferences in detailed textual form, our system only asks for a paper-slides example pair and a visual template - natural and easy-to-provide artifacts that implicitly encode rich user preferences across content and visual style. Despite the implicit and unlabeled nature of these inputs, our framework effectively distills and generalizes the preferences to guide customized slide generation. We also introduce a novel chain-of-speech mechanism to align slide content with planned oral narration. Such a design significantly enhances the quality of generated slides and enables downstream applications like video presentations. To support this new task, we construct a benchmark dataset that captures diverse user preferences, with carefully designed interpretable metrics for robust evaluation. Extensive experiments demonstrate the effectiveness of our framework.
PDF51December 30, 2025