MemMA : Coordination du cycle de mémoire par raisonnement multi-agent et auto-évolution in situ

Résumé

Les agents LLM à mémoire augmentée maintiennent des banques de mémoire externes pour supporter des interactions à long horizon, mais la plupart des systèmes existants traitent la construction, la récupération et l'utilisation comme des sous-programmes isolés. Cela crée deux défis couplés : l'aveuglement stratégique sur le chemin avant du cycle de mémoire, où la construction et la récupération sont pilotées par des heuristiques locales plutôt que par un raisonnement stratégique explicite, et une supervision éparse et retardée sur le chemin arrière, où les échecs en aval se traduisent rarement en réparations directes de la banque de mémoire. Pour relever ces défis, nous proposons MemMA, un framework multi-agent plug-and-play qui coordonne le cycle de mémoire le long des chemins avant et arrière. Sur le chemin avant, un Méta-Raisonneur produit des instructions structurées qui guident un Gestionnaire de Mémoire pendant la construction et orientent un Raisonneur de Requête pendant la récupération itérative. Sur le chemin arrière, MemMA introduit une construction de mémoire auto-évolutive in-situ, qui synthétise des paires question-réponse de test, vérifie la mémoire actuelle et convertit les échecs en actions de réparation avant que la mémoire ne soit finalisée. Des expériences approfondies sur LoCoMo montrent que MemMA surpasse constamment les méthodes de référence existantes sur plusieurs architectures LLM et améliore trois backends de stockage différents de manière plug-and-play. Notre code est disponible publiquement à l'adresse https://github.com/ventr1c/memma.

English

Memory-augmented LLM agents maintain external memory banks to support long-horizon interaction, yet most existing systems treat construction, retrieval, and utilization as isolated subroutines. This creates two coupled challenges: strategic blindness on the forward path of the memory cycle, where construction and retrieval are driven by local heuristics rather than explicit strategic reasoning, and sparse, delayed supervision on the backward path, where downstream failures rarely translate into direct repairs of the memory bank. To address these challenges, we propose MemMA, a plug-and-play multi-agent framework that coordinates the memory cycle along both the forward and backward paths. On the forward path, a Meta-Thinker produces structured guidance that steers a Memory Manager during construction and directs a Query Reasoner during iterative retrieval. On the backward path, MemMA introduces in-situ self-evolving memory construction, which synthesizes probe QA pairs, verifies the current memory, and converts failures into repair actions before the memory is finalized. Extensive experiments on LoCoMo show that MemMA consistently outperforms existing baselines across multiple LLM backbones and improves three different storage backends in a plug-and-play manner. Our code is publicly available at https://github.com/ventr1c/memma.

MemMA : Coordination du cycle de mémoire par raisonnement multi-agent et auto-évolution in situ

MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution

Résumé

Support