MemMA: Coordinación del Ciclo de Memoria mediante Razonamiento Multiagente y Autoevolución In Situ
MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution
March 19, 2026
Autores: Minhua Lin, Zhiwei Zhang, Hanqing Lu, Hui Liu, Xianfeng Tang, Qi He, Xiang Zhang, Suhang Wang
cs.AI
Resumen
Los agentes de LLM aumentados con memoria mantienen bancos de memoria externos para soportar interacciones de largo horizonte, sin embargo, la mayoría de los sistemas existentes tratan la construcción, recuperación y utilización como subrutinas aisladas. Esto crea dos desafíos acoplados: ceguera estratégica en la trayectoria hacia adelante del ciclo de memoria, donde la construcción y recuperación se rigen por heurísticas locales en lugar de un razonamiento estratégico explícito, y una supervisión escasa y retardada en la trayectoria hacia atrás, donde los fallos posteriores rara vez se traducen en reparaciones directas del banco de memoria. Para abordar estos desafíos, proponemos MemMA, un marco multiagente plug-and-play que coordina el ciclo de memoria a lo largo de ambas trayectorias. En la trayectoria hacia adelante, un Meta-Pensador produce una guía estructurada que dirige a un Gestor de Memoria durante la construcción y orienta a un Razonador de Consultas durante la recuperación iterativa. En la trayectoria hacia atrás, MemMA introduce una construcción de memoria de auto-evolución in-situ, que sintetiza pares de preguntas y respuestas de sondeo, verifica la memoria actual y convierte los fallos en acciones de reparación antes de que la memoria se finalice. Experimentos exhaustivos en LoCoMo muestran que MemMA supera consistentemente los baselines existentes en múltiples modelos base de LLM y mejora tres backends de almacenamiento diferentes de manera plug-and-play. Nuestro código está disponible públicamente en https://github.com/ventr1c/memma.
English
Memory-augmented LLM agents maintain external memory banks to support long-horizon interaction, yet most existing systems treat construction, retrieval, and utilization as isolated subroutines. This creates two coupled challenges: strategic blindness on the forward path of the memory cycle, where construction and retrieval are driven by local heuristics rather than explicit strategic reasoning, and sparse, delayed supervision on the backward path, where downstream failures rarely translate into direct repairs of the memory bank. To address these challenges, we propose MemMA, a plug-and-play multi-agent framework that coordinates the memory cycle along both the forward and backward paths. On the forward path, a Meta-Thinker produces structured guidance that steers a Memory Manager during construction and directs a Query Reasoner during iterative retrieval. On the backward path, MemMA introduces in-situ self-evolving memory construction, which synthesizes probe QA pairs, verifies the current memory, and converts failures into repair actions before the memory is finalized. Extensive experiments on LoCoMo show that MemMA consistently outperforms existing baselines across multiple LLM backbones and improves three different storage backends in a plug-and-play manner. Our code is publicly available at https://github.com/ventr1c/memma.