ChatPaper.aiChatPaper

PPTAgent: Generación y Evaluación de Presentaciones Más Allá de Texto a Diapositivas

PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

January 7, 2025
Autores: Hao Zheng, Xinyan Guan, Hao Kong, Jia Zheng, Hongyu Lin, Yaojie Lu, Ben He, Xianpei Han, Le Sun
cs.AI

Resumen

Generar presentaciones automáticamente a partir de documentos es una tarea desafiante que requiere equilibrar la calidad del contenido, el diseño visual y la coherencia estructural. Los métodos existentes se centran principalmente en mejorar y evaluar la calidad del contenido de forma aislada, a menudo pasando por alto el diseño visual y la coherencia estructural, lo que limita su aplicabilidad práctica. Para abordar estas limitaciones, proponemos PPTAgent, que mejora de manera integral la generación de presentaciones a través de un enfoque basado en edición de dos etapas inspirado en flujos de trabajo humanos. PPTAgent primero analiza presentaciones de referencia para comprender sus patrones estructurales y esquemas de contenido, luego elabora esquemas y genera diapositivas a través de acciones de código para garantizar consistencia y alineación. Para evaluar de manera integral la calidad de las presentaciones generadas, introducimos además PPTEval, un marco de evaluación que evalúa las presentaciones en tres dimensiones: Contenido, Diseño y Coherencia. Los experimentos muestran que PPTAgent supera significativamente a los métodos tradicionales de generación automática de presentaciones en las tres dimensiones. El código y los datos están disponibles en https://github.com/icip-cas/PPTAgent.
English
Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.

Summary

AI-Generated Summary

PDF203January 8, 2025