PPTAgent : Génération et Évaluation de Présentations au-delà de la Conversion Texte-diapositives

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

January 7, 2025
papers.authors: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI

papers.abstract

Générer automatiquement des présentations à partir de documents est une tâche complexe qui nécessite d'équilibrer la qualité du contenu, le design visuel et la cohérence structurelle. Les méthodes existantes se concentrent principalement sur l'amélioration et l'évaluation de la qualité du contenu de manière isolée, en négligeant souvent le design visuel et la cohérence structurelle, ce qui limite leur applicabilité pratique. Pour remédier à ces limitations, nous proposons PPTAgent, qui améliore de manière exhaustive la génération de présentations grâce à une approche en deux étapes basée sur l'édition, inspirée des flux de travail humains. PPTAgent analyse d'abord des présentations de référence pour comprendre leurs schémas structurels et leurs schémas de contenu, puis rédige des contours et génère des diapositives à travers des actions de code pour garantir la cohérence et l'alignement. Pour évaluer de manière exhaustive la qualité des présentations générées, nous introduisons en outre PPTEval, un cadre d'évaluation qui évalue les présentations selon trois dimensions : Contenu, Design et Cohérence. Les expériences montrent que PPTAgent surpasse significativement les méthodes traditionnelles de génération automatique de présentations sur les trois dimensions. Le code et les données sont disponibles sur https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.
PDF214January 8, 2025