Генерация презентаций из статей на основе сюжетной линии с помощью ArcDeck
Narrative-Driven Paper-to-Slide Generation via ArcDeck
April 13, 2026
Авторы: Tarik Can Ozden, Sachidanand VS, Furkan Horoz, Ozgur Kara, Junho Kim, James Matthew Rehg
cs.AI
Аннотация
Мы представляем ArcDeck — многоагентный фреймворк, который формулирует задачу генерации презентаций из научных статей как структурированную реконструкцию нарратива. В отличие от существующих методов, которые напрямую суммируют исходный текст в слайды, ArcDeck явно моделирует логическую структуру исходной статьи. Сначала система анализирует входные данные для построения дискурсивного дерева и создания глобального документа обязательств, обеспечивая сохранение высокоуровневой цели. Эти структурные априорные знания затем направляют итеративный процесс многоагентного уточнения, в котором специализированные агенты последовательно критикуют и修订 черновой набросок презентации перед финальной визуализацией макетов и дизайна. Для оценки нашего подхода мы также представляем ArcBench — новый тщательно отобранный бенчмарк пар "научная статья-презентация". Результаты экспериментов демонстрируют, что явное моделирование дискурса в сочетании с координацией агентов с четкими ролями значительно улучшает нарративный поток и логическую связность генерируемых презентаций.
English
We introduce ArcDeck, a multi-agent framework that formulates paper-to-slide generation as a structured narrative reconstruction task. Unlike existing methods that directly summarize raw text into slides, ArcDeck explicitly models the source paper's logical flow. It first parses the input to construct a discourse tree and establish a global commitment document, ensuring the high-level intent is preserved. These structural priors then guide an iterative multi-agent refinement process, where specialized agents iteratively critique and revise the presentation outline before rendering the final visual layouts and designs. To evaluate our approach, we also introduce ArcBench, a newly curated benchmark of academic paper-slide pairs. Experimental results demonstrate that explicit discourse modeling, combined with role-specific agent coordination, significantly improves the narrative flow and logical coherence of the generated presentations.