ChatPaper.aiChatPaper

MemSlides: 개인화된 슬라이드 생성과 다중 턴 로컬 수정을 위한 계층적 메모리 기반 에이전트 프레임워크

MemSlides: A Hierarchical Memory Driven Agent Framework for Personalized Slide Generation with Multi-turn Local Revision

June 15, 2026
저자: Ye Jin, Yangyang Xu, Jun Zhu, Yibo Yang
cs.AI

초록

개인화된 프레젠테이션 생성을 위해서는 현재 프롬프트나 템플릿에 조건화하는 것 이상이 필요하다. 에이전트는 작업 전반에 걸쳐 안정적인 사용자 선호도를 유지하고, 다중 턴 수정 중에 새로 도입된 선호도와 제약 조건을 보존하며, 국소적 편집을 신뢰성 있게 수행해야 한다. 우리는 개인화된 프레젠테이션 에이전트를 위한 계층적 메모리 프레임워크인 MemSlides를 제안한다. 이 프레임워크는 장기 메모리와 작업 메모리를 분리하고, 장기 메모리를 다시 사용자 프로필 메모리와 도구 메모리로 세분화한다. 사용자 프로필 메모리는 0차 개인화를 위한 의도 조건화 프로필을 저장하고, 작업 메모리는 수정 라운드 간 활성 선호도와 세션 제약 조건을 전달하며, 도구 메모리는 신뢰할 수 있는 국소적 편집을 위한 재사용 가능한 실행 경험을 저장한다. MemSlides는 이 메모리 설계를 범위가 지정된 슬라이드-국소 수정과 결합하여, 대상 업데이트가 전체 덱을 반복적으로 재생성하는 대신 가장 작은 영향 영역에 작용하도록 한다. 통제된 실험에서 사용자 프로필 메모리는 다중 페르소나, 다중 의도 프로필 뱅크에서 페르소나 정렬 판단을 개선하고, 도구 메모리 주입은 진단적 짝짓기 쌍 설정에서 폐쇄 루프 수정 동작을 개선하며, 정성적 사례는 작업 메모리가 선호도를 전달하는 능력을 보여준다. 종합해 보면, 이러한 결과는 프레젠테이션 저작에서 효과적인 개인화가 지속적 사용자 프로필, 세션 수준 작업 메모리, 그리고 생성 및 국소적 수정에 걸친 재사용 가능한 실행 경험을 분리하는 데 달려 있음을 시사한다.
English
Personalized presentation generation requires more than conditioning on a current prompt or template: agents must preserve stable user preferences across tasks, retain newly introduced preferences and constraints during multi-turn revision, and carry out local edits reliably. We propose MemSlides, a hierarchical memory framework for personalized presentation agents that separates long-term memory from working memory and further divides long-term memory into user profile memory and tool memory. User profile memory stores intent-conditioned profiles for round-0 personalization, working memory carries active preferences and session constraints across revision rounds, and tool memory stores reusable execution experience for reliable localized editing. MemSlides pairs this memory design with scoped slide-local revision, so targeted updates act on the smallest affected region instead of repeatedly regenerating the full deck. In controlled experiments, user profile memory improves persona-alignment judgments on a multi-persona, multi-intent profile bank, tool-memory injection improves closed-loop modify behavior in diagnostic matched-pair settings, and qualitative cases illustrate working memory's ability to carryover preferences. Taken together, these results suggest that effective personalization in presentation authoring depends on separating persistent user profiles, session-level working memory, and reusable execution experience across generation and localized revision.