PPTAgent : Génération et Évaluation de Présentations au-delà de la Conversion Texte-diapositives
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides
January 7, 2025
papers.authors: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI
papers.abstract
Générer automatiquement des présentations à partir de documents est une tâche complexe qui nécessite d'équilibrer la qualité du contenu, le design visuel et la cohérence structurelle. Les méthodes existantes se concentrent principalement sur l'amélioration et l'évaluation de la qualité du contenu de manière isolée, en négligeant souvent le design visuel et la cohérence structurelle, ce qui limite leur applicabilité pratique. Pour remédier à ces limitations, nous proposons PPTAgent, qui améliore de manière exhaustive la génération de présentations grâce à une approche en deux étapes basée sur l'édition, inspirée des flux de travail humains. PPTAgent analyse d'abord des présentations de référence pour comprendre leurs schémas structurels et leurs schémas de contenu, puis rédige des contours et génère des diapositives à travers des actions de code pour garantir la cohérence et l'alignement. Pour évaluer de manière exhaustive la qualité des présentations générées, nous introduisons en outre PPTEval, un cadre d'évaluation qui évalue les présentations selon trois dimensions : Contenu, Design et Cohérence. Les expériences montrent que PPTAgent surpasse significativement les méthodes traditionnelles de génération automatique de présentations sur les trois dimensions. Le code et les données sont disponibles sur https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task
that requires balancing content quality, visual design, and structural
coherence. Existing methods primarily focus on improving and evaluating the
content quality in isolation, often overlooking visual design and structural
coherence, which limits their practical applicability. To address these
limitations, we propose PPTAgent, which comprehensively improves presentation
generation through a two-stage, edit-based approach inspired by human
workflows. PPTAgent first analyzes reference presentations to understand their
structural patterns and content schemas, then drafts outlines and generates
slides through code actions to ensure consistency and alignment. To
comprehensively evaluate the quality of generated presentations, we further
introduce PPTEval, an evaluation framework that assesses presentations across
three dimensions: Content, Design, and Coherence. Experiments show that
PPTAgent significantly outperforms traditional automatic presentation
generation methods across all three dimensions. The code and data are available
at https://github.com/icip-cas/PPTAgent.