MemSlides: Ein hierarchisches, gedächtnisgesteuertes Agenten-Framework für die personalisierte Folien-Generierung mit mehrschrittiger lokaler Revision
MemSlides: A Hierarchical Memory Driven Agent Framework for Personalized Slide Generation with Multi-turn Local Revision
June 15, 2026
Autoren: Ye Jin, Yangyang Xu, Jun Zhu, Yibo Yang
cs.AI
Zusammenfassung
Die personalisierte Präsentationsgenerierung erfordert mehr als die Konditionierung auf einen aktuellen Prompt oder eine Vorlage: Agenten müssen stabile Nutzerpräferenzen über verschiedene Aufgaben hinweg bewahren, neu eingeführte Präferenzen und Einschränkungen während mehrfacher Überarbeitungsrunden beibehalten und lokale Bearbeitungen zuverlässig durchführen. Wir schlagen MemSlides vor, ein hierarchisches Gedächtnisframework für personalisierte Präsentationsagenten, das das Langzeitgedächtnis vom Arbeitsgedächtnis trennt und das Langzeitgedächtnis weiter in ein Nutzerprofilgedächtnis und ein Werkzeuggedächtnis unterteilt. Das Nutzerprofilgedächtnis speichert absichtsabhängige Profile für die Personalisierung in Runde 0, das Arbeitsgedächtnis trägt aktive Präferenzen und Sitzungseinschränkungen über Überarbeitungsrunden hinweg, und das Werkzeuggedächtnis speichert wiederverwendbare Ausführungserfahrung für zuverlässige lokalisierte Bearbeitungen. MemSlides kombiniert dieses Gedächtnisdesign mit einer bereichsbezogenen, folienlokalen Überarbeitung, sodass gezielte Aktualisierungen auf die kleinste betroffene Region wirken, anstatt die gesamte Präsentation wiederholt zu regenerieren. In kontrollierten Experimenten verbessert das Nutzerprofilgedächtnis die Beurteilungen der Personenübereinstimmung in einer mehrpersonen- und mehrzweckbezogenen Profildatenbank, die Injektion des Werkzeuggedächtnisses verbessert das geschlossene Modifikationsverhalten in diagnostischen, paarweise abgestimmten Umgebungen, und qualitative Fälle veranschaulichen die Fähigkeit des Arbeitsgedächtnisses, Präferenzen über verschiedene Aufgaben hinweg zu übertragen. Zusammengenommen deuten diese Ergebnisse darauf hin, dass eine effektive Personalisierung bei der Präsentationserstellung von der Trennung persistenter Nutzerprofile, sitzungsbezogenem Arbeitsgedächtnis und wiederverwendbarer Ausführungserfahrung während der Generierung und lokalisierten Überarbeitung abhängt.
English
Personalized presentation generation requires more than conditioning on a current prompt or template: agents must preserve stable user preferences across tasks, retain newly introduced preferences and constraints during multi-turn revision, and carry out local edits reliably. We propose MemSlides, a hierarchical memory framework for personalized presentation agents that separates long-term memory from working memory and further divides long-term memory into user profile memory and tool memory. User profile memory stores intent-conditioned profiles for round-0 personalization, working memory carries active preferences and session constraints across revision rounds, and tool memory stores reusable execution experience for reliable localized editing. MemSlides pairs this memory design with scoped slide-local revision, so targeted updates act on the smallest affected region instead of repeatedly regenerating the full deck. In controlled experiments, user profile memory improves persona-alignment judgments on a multi-persona, multi-intent profile bank, tool-memory injection improves closed-loop modify behavior in diagnostic matched-pair settings, and qualitative cases illustrate working memory's ability to carryover preferences. Taken together, these results suggest that effective personalization in presentation authoring depends on separating persistent user profiles, session-level working memory, and reusable execution experience across generation and localized revision.