SlideTailor : Génération personnalisée de diapositives de présentation pour articles scientifiques
SlideTailor: Personalized Presentation Slide Generation for Scientific Papers
December 23, 2025
papers.authors: Wenzheng Zeng, Mingyu Ouyang, Langyuan Cui, Hwee Tou Ng
cs.AI
papers.abstract
La génération automatique de diapositives de présentation peut considérablement rationaliser la création de contenu. Cependant, les préférences de chaque utilisateur pouvant varier, les formulations existantes sous-spécifiées produisent souvent des résultats sous-optimaux qui ne répondent pas aux besoins individuels des utilisateurs. Nous introduisons une nouvelle tâche qui conditionne la génération de diapositives à partir d'articles scientifiques sur des préférences spécifiées par l'utilisateur. Nous proposons un cadre agentiel inspiré du comportement humain, SlideTailor, qui génère progressivement des diapositives modifiables de manière alignée sur l'utilisateur. Au lieu d'exiger que les utilisateurs rédigent leurs préférences sous forme textuelle détaillée, notre système demande uniquement une paire d'exemples article-diapositives et un modèle visuel - des artefacts naturels et faciles à fournir qui encodent implicitement de riches préférences utilisateur en matière de contenu et de style visuel. Malgré la nature implicite et non étiquetée de ces entrées, notre cadre distille et généralise efficacement les préférences pour guider la génération de diapositives personnalisées. Nous introduisons également un nouveau mécanisme de chaîne de discours pour aligner le contenu des diapositives avec la narration orale planifiée. Une telle conception améliore significativement la qualité des diapositives générées et permet des applications en aval comme les présentations vidéo. Pour soutenir cette nouvelle tâche, nous constituons un jeu de données de référence qui capture des préférences utilisateur diverses, avec des métriques interprétables soigneusement conçues pour une évaluation robuste. Des expériences approfondies démontrent l'efficacité de notre cadre.
English
Automatic presentation slide generation can greatly streamline content creation. However, since preferences of each user may vary, existing under-specified formulations often lead to suboptimal results that fail to align with individual user needs. We introduce a novel task that conditions paper-to-slides generation on user-specified preferences. We propose a human behavior-inspired agentic framework, SlideTailor, that progressively generates editable slides in a user-aligned manner. Instead of requiring users to write their preferences in detailed textual form, our system only asks for a paper-slides example pair and a visual template - natural and easy-to-provide artifacts that implicitly encode rich user preferences across content and visual style. Despite the implicit and unlabeled nature of these inputs, our framework effectively distills and generalizes the preferences to guide customized slide generation. We also introduce a novel chain-of-speech mechanism to align slide content with planned oral narration. Such a design significantly enhances the quality of generated slides and enables downstream applications like video presentations. To support this new task, we construct a benchmark dataset that captures diverse user preferences, with carefully designed interpretable metrics for robust evaluation. Extensive experiments demonstrate the effectiveness of our framework.