ChatPaper.aiChatPaper

Génération de diapositives à partir de documents pilotée par la narration via ArcDeck

Narrative-Driven Paper-to-Slide Generation via ArcDeck

April 13, 2026
Auteurs: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg
cs.AI

Résumé

Nous présentons ArcDeck, un cadre multi-agents qui formule la génération de diapositives à partir d'un article scientifique comme une tâche de reconstruction narrative structurée. Contrairement aux méthodes existantes qui résument directement le texte brut en diapositives, ArcDeck modélise explicitement le flux logique de l'article source. Il analyse d'abord l'entrée pour construire un arbre de discours et établir un document d'engagement global, garantissant que l'intention de haut niveau est préservée. Ces prémisses structurelles guident ensuite un processus itératif de raffinement multi-agents, où des agents spécialisés critiquent et révisent itérativement le plan de la présentation avant de générer les mises en page et les conceptions visuelles finales. Pour évaluer notre approche, nous introduisons également ArcBench, un nouveau benchmark constitué de paires article-diapositives académiques. Les résultats expérimentaux démontrent que la modélisation explicite du discours, combinée à une coordination d'agents aux rôles spécifiques, améliore significativement le flux narratif et la cohérence logique des présentations générées.
English
We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.
PDF51April 17, 2026