ChatPaper.aiChatPaper

PPTAgent: Generierung und Evaluierung von Präsentationen über Text-zu-Folien hinaus

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

January 7, 2025
Autoren: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI

Zusammenfassung

Die automatische Generierung von Präsentationen aus Dokumenten ist eine anspruchsvolle Aufgabe, die ein ausgewogenes Verhältnis von Inhalt, visuellem Design und struktureller Kohärenz erfordert. Bestehende Methoden konzentrieren sich hauptsächlich auf die Verbesserung und Bewertung der Inhaltsqualität isoliert voneinander, wobei visuelles Design und strukturelle Kohärenz oft vernachlässigt werden, was ihre praktische Anwendbarkeit einschränkt. Um diese Einschränkungen zu überwinden, schlagen wir PPTAgent vor, der die Präsentationsgenerierung umfassend durch einen zweistufigen, editierbasierten Ansatz verbessert, der von menschlichen Arbeitsabläufen inspiriert ist. PPTAgent analysiert zunächst Referenzpräsentationen, um ihre strukturellen Muster und Inhaltschemas zu verstehen, erstellt dann Gliederungen und generiert Folien durch Codeaktionen, um Konsistenz und Ausrichtung sicherzustellen. Zur umfassenden Bewertung der Qualität generierter Präsentationen führen wir weiterhin PPTEval ein, ein Bewertungsrahmenwerk, das Präsentationen in drei Dimensionen bewertet: Inhalt, Design und Kohärenz. Experimente zeigen, dass PPTAgent traditionelle automatische Präsentationsgenerierungsmethoden in allen drei Dimensionen signifikant übertrifft. Der Code und die Daten sind unter https://github.com/icip-cas/PPTAgent verfügbar.
English
Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.

Summary

AI-Generated Summary

PDF203January 8, 2025