MemMA: Coordinazione del Ciclo di Memoria attraverso Ragionamento Multi-Agente e Auto-Evoluzione In-Situ

Abstract

Gli agenti LLM potenziati con memoria mantengono banchi di memoria esterni per supportare interazioni a lungo termine, tuttavia la maggior parte dei sistemi esistenti tratta costruzione, recupero e utilizzo come subroutine isolate. Ciò crea due sfide accoppiate: cecità strategica nel percorso in avanti del ciclo di memoria, dove costruzione e recupero sono guidati da euristiche locali anziché da ragionamenti strategici espliciti, e supervisione rada e ritardata nel percorso all'indietro, dove i fallimenti a valle raramente si traducono in riparazioni dirette del banco di memoria. Per affrontare queste sfide, proponiamo MemMA, un framework multi-agente plug-and-play che coordina il ciclo di memoria lungo entrambi i percorsi. Nel percorso in avanti, un Meta-Pensatore produce linee guida strutturate che orientano un Gestore della Memoria durante la costruzione e dirigono un Motore di Interrogazione durante il recupero iterativo. Nel percorso all'indietro, MemMA introduce una costruzione di memoria auto-evolutiva in situ, che sintetizza coppie di domande-risposte di prova, verifica la memoria corrente e converte i fallimenti in azioni di riparazione prima che la memoria sia finalizzata. Esperimenti estensivi su LoCoMo mostrano che MemMA supera costantemente i baseline esistenti su molteplici backbone LLM e migliora tre diversi backend di archiviazione in modalità plug-and-play. Il nostro codice è pubblicamente disponibile all'indirizzo https://github.com/ventr1c/memma.

English

Memory-augmented LLM agents maintain external memory banks to support long-horizon interaction, yet most existing systems treat construction, retrieval, and utilization as isolated subroutines. This creates two coupled challenges: strategic blindness on the forward path of the memory cycle, where construction and retrieval are driven by local heuristics rather than explicit strategic reasoning, and sparse, delayed supervision on the backward path, where downstream failures rarely translate into direct repairs of the memory bank. To address these challenges, we propose MemMA, a plug-and-play multi-agent framework that coordinates the memory cycle along both the forward and backward paths. On the forward path, a Meta-Thinker produces structured guidance that steers a Memory Manager during construction and directs a Query Reasoner during iterative retrieval. On the backward path, MemMA introduces in-situ self-evolving memory construction, which synthesizes probe QA pairs, verifies the current memory, and converts failures into repair actions before the memory is finalized. Extensive experiments on LoCoMo show that MemMA consistently outperforms existing baselines across multiple LLM backbones and improves three different storage backends in a plug-and-play manner. Our code is publicly available at https://github.com/ventr1c/memma.

MemMA: Coordinazione del Ciclo di Memoria attraverso Ragionamento Multi-Agente e Auto-Evoluzione In-Situ

MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution

Abstract

Support