ChatPaper.aiChatPaper

SlideTailor: Персонализированное создание презентационных слайдов для научных статей

SlideTailor: Personalized Presentation Slide Generation for Scientific Papers

December 23, 2025
Авторы: Wenzheng Zeng, Mingyu Ouyang, Langyuan Cui, Hwee Tou Ng
cs.AI

Аннотация

Автоматическое создание презентационных слайдов может значительно упростить процесс разработки контента. Однако, поскольку предпочтения каждого пользователя могут различаться, существующие недостаточно специфицированные подходы часто приводят к субоптимальным результатам, не соответствующим индивидуальным потребностям пользователей. Мы представляем новую задачу генерации слайдов на основе научных статей с учётом предпочтений пользователя. Предлагаем вдохновлённую человеческим поведением агентную архитектуру SlideTailor, которая постепенно создаёт редактируемые слайды в соответствии с пользовательскими требованиями. Вместо необходимости формулировать предпочтения в виде подробного текстового описания, наша система запрашивает лишь пример пары "статья-слайды" и визуальный шаблон — естественные и легко предоставляемые артефакты, которые неявно кодируют богатые пользовательские предпочтения относительно содержания и визуального стиля. Несмотря на неявный и немаркированный характер этих входных данных, наш фреймворк эффективно выявляет и обобщает предпочтения для управления кастомизированной генерацией слайдов. Мы также представляем новый механизм chain-of-speech для согласования содержания слайдов с планируемой устной презентацией. Такое решение значительно повышает качество генерируемых слайдов и открывает возможности для последующих приложений, таких как видеопрезентации. Для поддержки этой новой задачи мы создали эталонный набор данных, отражающий разнообразные пользовательские предпочтения, с тщательно разработанными интерпретируемыми метриками для надёжной оценки. Масштабные эксперименты демонстрируют эффективность нашего подхода.
English
Automatic presentation slide generation can greatly streamline content creation. However, since preferences of each user may vary, existing under-specified formulations often lead to suboptimal results that fail to align with individual user needs. We introduce a novel task that conditions paper-to-slides generation on user-specified preferences. We propose a human behavior-inspired agentic framework, SlideTailor, that progressively generates editable slides in a user-aligned manner. Instead of requiring users to write their preferences in detailed textual form, our system only asks for a paper-slides example pair and a visual template - natural and easy-to-provide artifacts that implicitly encode rich user preferences across content and visual style. Despite the implicit and unlabeled nature of these inputs, our framework effectively distills and generalizes the preferences to guide customized slide generation. We also introduce a novel chain-of-speech mechanism to align slide content with planned oral narration. Such a design significantly enhances the quality of generated slides and enables downstream applications like video presentations. To support this new task, we construct a benchmark dataset that captures diverse user preferences, with carefully designed interpretable metrics for robust evaluation. Extensive experiments demonstrate the effectiveness of our framework.
PDF51December 30, 2025