ChatPaper.aiChatPaper

Het AI-hippocampus: hoe ver zijn we verwijderd van het menselijk geheugen?

The AI Hippocampus: How Far are We From Human Memory?

January 14, 2026
Auteurs: Zixia Jia, Jiaqi Li, Yipeng Kang, Yuxuan Wang, Tong Wu, Quansen Wang, Xiaobo Wang, Shuyi Zhang, Junzhe Shen, Qing Li, Siyuan Qi, Yitao Liang, Di He, Zilong Zheng, Song-Chun Zhu
cs.AI

Samenvatting

Geheugen speelt een fundamentele rol bij het vergroten van het redeneervermogen, de aanpasbaarheid en de contextuele nauwkeurigheid van moderne Large Language Models en Multi-Modal LLMs. Naarmate deze modellen evolueren van statische voorspellers naar interactieve systemen die in staat zijn tot continu leren en gepersonaliseerde inferentie, is de integratie van geheugenmechanismen een centraal thema geworden in hun architecturale en functionele ontwikkeling. Dit overzichtsartikel presenteert een uitgebreide en gestructureerde synthese van geheugen in LLMs en MLLMs, waarbij de literatuur wordt georganiseerd in een samenhangende taxonomie bestaande uit impliciete, expliciete en agent-gebaseerde geheugenparadigma's. Het onderzoek onderscheidt specifiek drie primaire geheugenkaders. Impliciet geheugen verwijst naar de kennis die is ingebed in de interne parameters van vooraf getrainde transformers, inclusief hun vermogen tot memorisatie, associatief ophalen en contextueel redeneren. Recent werk heeft methoden onderzocht om dit latente geheugen te interpreteren, manipuleren en herconfigureren. Expliciet geheugen omvat externe opslag- en ophaalcomponenten die zijn ontworpen om modeloutputs aan te vullen met dynamische, bevraagbare kennisrepresentaties, zoals tekstuele corpora, dichte vectoren en op grafen gebaseerde structuren, waardoor schaalbare en bijwerkbare interactie met informatiebronnen mogelijk wordt. Agent-gebaseerd geheugen introduceert persistente, temporeel uitgebreide geheugenstructuren binnen autonome agents, die langetermijnplanning, zelfconsistentie en collaboratief gedrag in multi-agent systemen faciliteren, met relevantie voor embodied en interactieve AI. Het onderzoek gaat verder dan tekst en onderzoekt de integratie van geheugen in multi-modale settings, waar coherentie tussen visie, taal, audio en actiemodaliteiten essentieel is. Belangrijke architecturale vooruitgang, benchmarktaken en open uitdagingen worden besproken, waaronder kwesties met betrekking tot geheugencapaciteit, uitlijning, feitelijke consistentie en kruis-systeem interoperabiliteit.
English
Memory plays a foundational role in augmenting the reasoning, adaptability, and contextual fidelity of modern Large Language Models and Multi-Modal LLMs. As these models transition from static predictors to interactive systems capable of continual learning and personalized inference, the incorporation of memory mechanisms has emerged as a central theme in their architectural and functional evolution. This survey presents a comprehensive and structured synthesis of memory in LLMs and MLLMs, organizing the literature into a cohesive taxonomy comprising implicit, explicit, and agentic memory paradigms. Specifically, the survey delineates three primary memory frameworks. Implicit memory refers to the knowledge embedded within the internal parameters of pre-trained transformers, encompassing their capacity for memorization, associative retrieval, and contextual reasoning. Recent work has explored methods to interpret, manipulate, and reconfigure this latent memory. Explicit memory involves external storage and retrieval components designed to augment model outputs with dynamic, queryable knowledge representations, such as textual corpora, dense vectors, and graph-based structures, thereby enabling scalable and updatable interaction with information sources. Agentic memory introduces persistent, temporally extended memory structures within autonomous agents, facilitating long-term planning, self-consistency, and collaborative behavior in multi-agent systems, with relevance to embodied and interactive AI. Extending beyond text, the survey examines the integration of memory within multi-modal settings, where coherence across vision, language, audio, and action modalities is essential. Key architectural advances, benchmark tasks, and open challenges are discussed, including issues related to memory capacity, alignment, factual consistency, and cross-system interoperability.
PDF52February 27, 2026