PPTAgent: Генерация и оценка презентаций за пределами текста-слайдов
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
January 7, 2025
Авторы: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI
Аннотация
Автоматическое создание презентаций из документов представляет собой сложную задачу, требующую балансировки качества контента, визуального дизайна и структурной связности. Существующие методы в основном сосредотачиваются на улучшении и оценке качества контента в изоляции, часто игнорируя визуальный дизайн и структурную связность, что ограничивает их практическую применимость. Для решения этих ограничений мы предлагаем PPTAgent, который всесторонне улучшает создание презентаций через двухэтапный подход на основе редактирования, вдохновленный человеческими рабочими процессами. PPTAgent сначала анализирует образцовые презентации для понимания их структурных шаблонов и схем контента, затем создает конспекты и генерирует слайды с помощью действий кода для обеспечения согласованности и выравнивания. Для всесторонней оценки качества созданных презентаций мы дополнительно представляем PPTEval, фреймворк оценки, который оценивает презентации по трем измерениям: Контент, Дизайн и Связность. Эксперименты показывают, что PPTAgent значительно превосходит традиционные методы автоматического создания презентаций по всем трем измерениям. Код и данные доступны по ссылке https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task
that requires balancing content quality, visual design, and structural
coherence. Existing methods primarily focus on improving and evaluating the
content quality in isolation, often overlooking visual design and structural
coherence, which limits their practical applicability. To address these
limitations, we propose PPTAgent, which comprehensively improves presentation
generation through a two-stage, edit-based approach inspired by human
workflows. PPTAgent first analyzes reference presentations to understand their
structural patterns and content schemas, then drafts outlines and generates
slides through code actions to ensure consistency and alignment. To
comprehensively evaluate the quality of generated presentations, we further
introduce PPTEval, an evaluation framework that assesses presentations across
three dimensions: Content, Design, and Coherence. Experiments show that
PPTAgent significantly outperforms traditional automatic presentation
generation methods across all three dimensions. The code and data are available
at https://github.com/icip-cas/PPTAgent.Summary
AI-Generated Summary