La memoria en la era de los agentes de IA
Memory in the Age of AI Agents
December 15, 2025
Autores: Yuyang Hu, Shichun Liu, Yanwei Yue, Guibin Zhang, Boyang Liu, Fangyi Zhu, Jiahang Lin, Honglin Guo, Shihan Dou, Zhiheng Xi, Senjie Jin, Jiejun Tan, Yanbin Yin, Jiongnan Liu, Zeyu Zhang, Zhongxiang Sun, Yutao Zhu, Hao Sun, Boci Peng, Zhenrong Cheng, Xuanbo Fan, Jiaxin Guo, Xinlei Yu, Zhenhong Zhou, Zewen Hu, Jiahao Huo, Junhao Wang, Yuwei Niu, Yu Wang, Zhenfei Yin, Xiaobin Hu, Yue Liao, Qiankun Li, Kun Wang, Wangchunshu Zhou, Yixin Liu, Dawei Cheng, Qi Zhang, Tao Gui, Shirui Pan, Yan Zhang, Philip Torr, Zhicheng Dou, Ji-Rong Wen, Xuanjing Huang, Yu-Gang Jiang, Shuicheng Yan
cs.AI
Resumen
La memoria ha surgido, y continuará siendo, una capacidad fundamental de los agentes basados en modelos fundacionales. A medida que la investigación sobre la memoria de los agentes se expande rápidamente y atrae una atención sin precedentes, el campo también se ha vuelto cada vez más fragmentado. Los trabajos existentes que se engloban bajo el paraguas de la memoria de los agentes a menudo difieren sustancialmente en sus motivaciones, implementaciones y protocolos de evaluación, mientras que la proliferación de terminologías de memoria débilmente definidas ha oscurecido aún más la claridad conceptual. Las taxonomías tradicionales, como la memoria a largo/corto plazo, han demostrado ser insuficientes para capturar la diversidad de los sistemas de memoria de agentes contemporáneos. Este trabajo pretende ofrecer una panorámica actualizada de la investigación actual sobre la memoria de los agentes. Comenzamos delimitando claramente el alcance de la memoria de los agentes y distinguiéndola de conceptos relacionados como la memoria de los LLM, la generación aumentada por recuperación (RAG) y la ingeniería de contexto. A continuación, examinamos la memoria de los agentes a través de las lentes unificadas de las formas, las funciones y la dinámica. Desde la perspectiva de las formas, identificamos tres realizaciones dominantes de la memoria de los agentes: la memoria a nivel de token, paramétrica y latente. Desde la perspectiva de las funciones, proponemos una taxonomía más granular que distingue entre memoria factual, experiencial y de trabajo. Desde la perspectiva de la dinámica, analizamos cómo se forma, evoluciona y recupera la memoria a lo largo del tiempo. Para apoyar el desarrollo práctico, recopilamos un resumen exhaustivo de benchmarks de memoria y frameworks de código abierto. Más allá de la consolidación, articulamos una perspectiva prospectiva sobre las fronteras emergentes de la investigación, incluyendo la automatización de la memoria, la integración con el aprendizaje por refuerzo, la memoria multimodal, la memoria multi-agente y los problemas de confiabilidad. Esperamos que este estudio sirva no solo como referencia para el trabajo existente, sino también como una base conceptual para repensar la memoria como un primitivo de primera clase en el diseño de la inteligencia agentiva futura.
English
Memory has emerged, and will continue to remain, a core capability of foundation model-based agents. As research on agent memory rapidly expands and attracts unprecedented attention, the field has also become increasingly fragmented. Existing works that fall under the umbrella of agent memory often differ substantially in their motivations, implementations, and evaluation protocols, while the proliferation of loosely defined memory terminologies has further obscured conceptual clarity. Traditional taxonomies such as long/short-term memory have proven insufficient to capture the diversity of contemporary agent memory systems. This work aims to provide an up-to-date landscape of current agent memory research. We begin by clearly delineating the scope of agent memory and distinguishing it from related concepts such as LLM memory, retrieval augmented generation (RAG), and context engineering. We then examine agent memory through the unified lenses of forms, functions, and dynamics. From the perspective of forms, we identify three dominant realizations of agent memory, namely token-level, parametric, and latent memory. From the perspective of functions, we propose a finer-grained taxonomy that distinguishes factual, experiential, and working memory. From the perspective of dynamics, we analyze how memory is formed, evolved, and retrieved over time. To support practical development, we compile a comprehensive summary of memory benchmarks and open-source frameworks. Beyond consolidation, we articulate a forward-looking perspective on emerging research frontiers, including memory automation, reinforcement learning integration, multimodal memory, multi-agent memory, and trustworthiness issues. We hope this survey serves not only as a reference for existing work, but also as a conceptual foundation for rethinking memory as a first-class primitive in the design of future agentic intelligence.