Generación de Diapositivas a partir de Artículos Basada en Narrativa mediante ArcDeck
Narrative-Driven Paper-to-Slide Generation via ArcDeck
April 13, 2026
Autores: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg
cs.AI
Resumen
Presentamos ArcDeck, un marco de trabajo multiagente que formula la generación de presentaciones a partir de artículos como una tarea de reconstrucción narrativa estructurada. A diferencia de los métodos existentes que resumen texto directamente en diapositivas, ArcDeck modela explícitamente el flujo lógico del artículo fuente. Primero analiza la entrada para construir un árbol de discurso y establecer un documento de compromiso global, garantizando que se preserve la intención de alto nivel. Estos *priors* estructurales guían luego un proceso iterativo de refinamiento multiagente, donde agentes especializados critican y revisan iterativamente el esquema de la presentación antes de renderizar los diseños y disposiciones visuales finales. Para evaluar nuestro enfoque, también presentamos ArcBench, un nuevo punto de referencia curado de pares artículo-diapositiva académicos. Los resultados experimentales demuestran que el modelado explícito del discurso, combinado con una coordinación de agentes por roles, mejora significativamente la fluidez narrativa y la coherencia lógica de las presentaciones generadas.
English
We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.