Generazione di Presentazioni da Testo Narrativo tramite ArcDeck
Narrative-Driven Paper-to-Slide Generation via ArcDeck
April 13, 2026
Autori: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg
cs.AI
Abstract
Presentiamo ArcDeck, un framework multi-agente che formula la generazione di slide da articoli come un'attività di ricostruzione narrativa strutturata. A differenza dei metodi esistenti che riassumono direttamente il testo grezzo in slide, ArcDeck modella esplicitamente il flusso logico dell'articolo sorgente. Il sistema analizza prima l'input per costruire un albero del discorso e stabilire un documento di intenti globale, garantendo la preservazione dell'intento di alto livello. Questi prerequisiti strutturali guidano quindi un processo iterativo di raffinamento multi-agente, in cui agenti specializzati criticano e revisionano iterativamente la bozza della presentazione prima di renderizzare i layout visivi e i design finali. Per valutare il nostro approccio, introduciamo anche ArcBench, un benchmark di nuova creazione composto da coppie articolo accademico-slide. I risultati sperimentali dimostrano che la modellazione esplicita del discorso, combinata con il coordinamento di agenti con ruoli specifici, migliora significativamente la fluidità narrativa e la coerenza logica delle presentazioni generate.
English
We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.