MemSlides: Иерархическая агентная структура, управляемая памятью, для персонализированной генерации слайдов с многократной локальной доработкой
MemSlides: A Hierarchical Memory Driven Agent Framework for Personalized Slide Generation with Multi-turn Local Revision
June 15, 2026
Авторы: Ye Jin, Yangyang Xu, Jun Zhu, Yibo Yang
cs.AI
Аннотация
Генерация персонализированных презентаций требует не только адаптации к текущему запросу или шаблону: агенты должны сохранять стабильные пользовательские предпочтения между задачами, удерживать вновь введённые предпочтения и ограничения в ходе многораундового редактирования, а также надёжно выполнять локальные правки. Мы предлагаем MemSlides — иерархическую структуру памяти для агентов персонализированных презентаций, которая разделяет долговременную и рабочую память, а также дополнительно подразделяет долговременную память на память профилей пользователей и инструментальную память. Память профилей пользователей хранит профили, обусловленные намерениями, для персонализации на нулевом раунде; рабочая память переносит активные предпочтения и ограничения сеанса между раундами редактирования; инструментальная память хранит повторно используемый опыт выполнения для надёжного локального редактирования. MemSlides дополняет эту архитектуру памяти ограниченной по области локальной правкой слайдов, так что целевые обновления воздействуют на наименьшую затронутую область вместо повторной генерации всей презентации. В контролируемых экспериментах память профилей пользователей улучшает оценки соответствия персонажу в банке профилей с несколькими персонажами и намерениями, внедрение инструментальной памяти улучшает поведение при модификации в замкнутом цикле в диагностических настройках с парным сравнением, а качественные примеры иллюстрируют способность рабочей памяти переносить предпочтения. В совокупности эти результаты указывают на то, что эффективная персонализация при создании презентаций зависит от разделения устойчивых профилей пользователей, рабочей памяти на уровне сеанса и повторно используемого опыта выполнения на этапах генерации и локального редактирования.
English
Personalized presentation generation requires more than conditioning on a current prompt or template: agents must preserve stable user preferences across tasks, retain newly introduced preferences and constraints during multi-turn revision, and carry out local edits reliably. We propose MemSlides, a hierarchical memory framework for personalized presentation agents that separates long-term memory from working memory and further divides long-term memory into user profile memory and tool memory. User profile memory stores intent-conditioned profiles for round-0 personalization, working memory carries active preferences and session constraints across revision rounds, and tool memory stores reusable execution experience for reliable localized editing. MemSlides pairs this memory design with scoped slide-local revision, so targeted updates act on the smallest affected region instead of repeatedly regenerating the full deck. In controlled experiments, user profile memory improves persona-alignment judgments on a multi-persona, multi-intent profile bank, tool-memory injection improves closed-loop modify behavior in diagnostic matched-pair settings, and qualitative cases illustrate working memory's ability to carryover preferences. Taken together, these results suggest that effective personalization in presentation authoring depends on separating persistent user profiles, session-level working memory, and reusable execution experience across generation and localized revision.