ChatPaper.aiChatPaper

PPTAgent: Het Genereren en Evalueren van Presentaties Voorbij Tekst-naar-Slides.

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

January 7, 2025
Auteurs: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI

Samenvatting

Het automatisch genereren van presentaties vanuit documenten is een uitdagende taak die een balans vereist tussen inhoudskwaliteit, visueel ontwerp en structurele coherentie. Bestaande methoden richten zich voornamelijk op het verbeteren en evalueren van de inhoudskwaliteit op zichzelf, waarbij vaak het visuele ontwerp en de structurele coherentie over het hoofd worden gezien, wat hun praktische toepasbaarheid beperkt. Om deze beperkingen aan te pakken, stellen we PPTAgent voor, dat de presentatiegeneratie op een allesomvattende manier verbetert door middel van een op bewerkingen gebaseerde aanpak geïnspireerd op menselijke workflows. PPTAgent analyseert eerst referentiepresentaties om hun structurele patronen en inhoudsschema's te begrijpen, stelt dan een opzet op en genereert dia's via codeacties om consistentie en afstemming te waarborgen. Om de kwaliteit van gegenereerde presentaties uitgebreid te evalueren, introduceren we verder PPTEval, een evaluatiekader dat presentaties beoordeelt op drie dimensies: Inhoud, Ontwerp en Coherentie. Experimenten tonen aan dat PPTAgent aanzienlijk beter presteert dan traditionele methoden voor automatische presentatiegeneratie op alle drie dimensies. De code en gegevens zijn beschikbaar op https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.

Summary

AI-Generated Summary

PDF203January 8, 2025