Erinnerung im Zeitalter der KI-Agenten
Memory in the Age of AI Agents
December 15, 2025
papers.authors: Yuyang Hu, Shichun Liu, Yanwei Yue, Guibin Zhang, Boyang Liu, Fangyi Zhu, Jiahang Lin, Honglin Guo, Shihan Dou, Zhiheng Xi, Senjie Jin, Jiejun Tan, Yanbin Yin, Jiongnan Liu, Zeyu Zhang, Zhongxiang Sun, Yutao Zhu, Hao Sun, Boci Peng, Zhenrong Cheng, Xuanbo Fan, Jiaxin Guo, Xinlei Yu, Zhenhong Zhou, Zewen Hu, Jiahao Huo, Junhao Wang, Yuwei Niu, Yu Wang, Zhenfei Yin, Xiaobin Hu, Yue Liao, Qiankun Li, Kun Wang, Wangchunshu Zhou, Yixin Liu, Dawei Cheng, Qi Zhang, Tao Gui, Shirui Pan, Yan Zhang, Philip Torr, Zhicheng Dou, Ji-Rong Wen, Xuanjing Huang, Yu-Gang Jiang, Shuicheng Yan
cs.AI
papers.abstract
Das Gedächtnis hat sich als eine zentrale Fähigkeit von Agenten auf Basis von Fundamentalmodellen etabliert und wird dies auch weiterhin bleiben. Während die Forschung zum Agentengedächtnis rapide expandiert und beispiellose Aufmerksamkeit auf sich zieht, wird das Feld zunehmend fragmentierter. Bestehende Arbeiten, die unter den Oberbegriff des Agentengedächtnisses fallen, unterscheiden sich oft erheblich in ihrer Motivation, Implementierung und Evaluierungsmethodik, während die Verbreitung von lose definierten Gedächtnisbegriffen die konzeptionelle Klarheit weiter verschleiert. Traditionelle Taxonomien wie Langzeit-/Kurzzeitgedächtnis haben sich als unzureichend erwiesen, um die Vielfalt moderner Agentengedächtnissysteme zu erfassen. Diese Arbeit zielt darauf ab, einen aktuellen Überblick über die Forschung zum Agentengedächtnis zu geben. Wir beginnen mit einer klaren Abgrenzung des Anwendungsbereichs des Agentengedächtnisses und unterscheiden es von verwandten Konzepten wie LLM-Gedächtnis, Retrieval-Augmented Generation (RAG) und Kontextengineering. Anschließend betrachten wir das Agentengedächtnis durch die vereinheitlichten Linsen von Formen, Funktionen und Dynamiken. Aus der Perspektive der Formen identifizieren wir drei dominante Realisierungen des Agentengedächtnisses: Token-Level-, parametrisches und latentes Gedächtnis. Aus der Perspektive der Funktionen schlagen wir eine feiner granulierte Taxonomie vor, die zwischen Faktengedächtnis, Erfahrungsgedächtnis und Arbeitsgedächtnis unterscheidet. Aus der Perspektive der Dynamiken analysieren wir, wie Gedächtnis über die Zeit gebildet, weiterentwickelt und abgerufen wird. Um die praktische Entwicklung zu unterstützen, erstellen wir eine umfassende Zusammenfassung von Gedächtnis-Benchmarks und Open-Source-Frameworks. Über die Konsolidierung hinaus skizzieren wir eine vorausschauende Perspektive auf neu entstehende Forschungsfronten, einschließlich Gedächtnisautomatisierung, Reinforcement-Learning-Integration, multimodalem Gedächtnis, Multi-Agenten-Gedächtnis und Vertrauenswürdigkeitsfragen. Wir hoffen, dass dieser Survey nicht nur als Referenz für bestehende Arbeiten dient, sondern auch als konzeptionelle Grundlage, um Gedächtnis als First-Class-Primitive im Design zukünftiger agentenbasierter Intelligenz neu zu denken.
English
Memory has emerged, and will continue to remain, a core capability of foundation model-based agents. As research on agent memory rapidly expands and attracts unprecedented attention, the field has also become increasingly fragmented. Existing works that fall under the umbrella of agent memory often differ substantially in their motivations, implementations, and evaluation protocols, while the proliferation of loosely defined memory terminologies has further obscured conceptual clarity. Traditional taxonomies such as long/short-term memory have proven insufficient to capture the diversity of contemporary agent memory systems. This work aims to provide an up-to-date landscape of current agent memory research. We begin by clearly delineating the scope of agent memory and distinguishing it from related concepts such as LLM memory, retrieval augmented generation (RAG), and context engineering. We then examine agent memory through the unified lenses of forms, functions, and dynamics. From the perspective of forms, we identify three dominant realizations of agent memory, namely token-level, parametric, and latent memory. From the perspective of functions, we propose a finer-grained taxonomy that distinguishes factual, experiential, and working memory. From the perspective of dynamics, we analyze how memory is formed, evolved, and retrieved over time. To support practical development, we compile a comprehensive summary of memory benchmarks and open-source frameworks. Beyond consolidation, we articulate a forward-looking perspective on emerging research frontiers, including memory automation, reinforcement learning integration, multimodal memory, multi-agent memory, and trustworthiness issues. We hope this survey serves not only as a reference for existing work, but also as a conceptual foundation for rethinking memory as a first-class primitive in the design of future agentic intelligence.