Geração de Slides a partir de Texto Orientada por Narrativa via ArcDeck
Narrative-Driven Paper-to-Slide Generation via ArcDeck
April 13, 2026
Autores: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg
cs.AI
Resumo
Apresentamos o ArcDeck, uma estrutura multiagente que formula a geração de apresentações a partir de artigos como uma tarefa de reconstrução narrativa estruturada. Diferente dos métodos existentes que resumem texto bruto diretamente em slides, o ArcDeck modela explicitamente o fluxo lógico do artigo fonte. Ele primeiro analisa o texto de entrada para construir uma árvore de discurso e estabelecer um documento de compromisso global, garantindo a preservação da intenção de alto nível. Esses *priors* estruturais então orientam um processo iterativo de refinamento multiagente, onde agentes especializados criticam e revisam iterativamente o esboço da apresentação antes de renderizar os layouts visuais e designs finais. Para avaliar nossa abordagem, também introduzimos o ArcBench, um novo benchmark curado de pares artigo-slide acadêmicos. Resultados experimentais demonstram que a modelagem explícita do discurso, combinada com a coordenação de agentes com funções específicas, melhora significativamente o fluxo narrativo e a coerência lógica das apresentações geradas.
English
We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.