MemMA: Koordination des Speicherzyklus durch Multi-Agenten-Reasoning und In-situ-Selbstevolution
MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution
March 19, 2026
Autoren: Minhua Lin, Zhiwei Zhang, Hanqing Lu, Hui Liu, Xianfeng Tang, Qi He, Xiang Zhang, Suhang Wang
cs.AI
Zusammenfassung
Gedächtnis-erweiterte LLM-Agenten unterhalten externe Gedächtnisbanken zur Unterstützung langfristiger Interaktionen, doch die meisten bestehenden Systeme behandeln Konstruktion, Abfrage und Nutzung als isolierte Teilroutinen. Dies führt zu zwei gekoppelten Herausforderungen: strategische Blindheit auf dem Vorwärtspfad des Gedächtniszyklus, bei dem Konstruktion und Abfrage von lokalen Heuristiken anstatt von expliziter strategischer Überlegung gesteuert werden, sowie spärliche, verzögerte Rückmeldung auf dem Rückwärtspfad, bei der nachgelagerte Fehler selten zu direkten Reparaturen der Gedächtnisbank führen. Um diese Herausforderungen zu adressieren, schlagen wir MemMA vor, ein Plug-and-Play-Multi-Agenten-Framework, das den Gedächtniszyklus entlang sowohl des Vorwärts- als auch des Rückwärtspfades koordiniert. Auf dem Vorwärtspfad erzeugt ein Meta-Denker strukturierte Anleitungen, die einen Gedächtnis-Manager während der Konstruktion steuern und einen Abfrage-Begründer während der iterativen Abfrage lenken. Auf dem Rückwärtspfad führt MemMA eine situative, selbst-evolvierende Gedächtniskonstruktion ein, die Test-Frage-Antwort-Paare synthetisiert, den aktuellen Gedächtnisstand verifiziert und Fehler in Reparaturaktionen umwandelt, bevor das Gedächtnis finalisiert wird. Umfangreiche Experimente auf LoCoMo zeigen, dass MemMA bestehende Baseline-Methoden über mehrere LLM-Backbones hinweg konsistent übertrifft und drei verschiedene Speicher-Backends auf Plug-and-Play-Weise verbessert. Unser Code ist öffentlich verfügbar unter https://github.com/ventr1c/memma.
English
Memory-augmented LLM agents maintain external memory banks to support long-horizon interaction, yet most existing systems treat construction, retrieval, and utilization as isolated subroutines. This creates two coupled challenges: strategic blindness on the forward path of the memory cycle, where construction and retrieval are driven by local heuristics rather than explicit strategic reasoning, and sparse, delayed supervision on the backward path, where downstream failures rarely translate into direct repairs of the memory bank. To address these challenges, we propose MemMA, a plug-and-play multi-agent framework that coordinates the memory cycle along both the forward and backward paths. On the forward path, a Meta-Thinker produces structured guidance that steers a Memory Manager during construction and directs a Query Reasoner during iterative retrieval. On the backward path, MemMA introduces in-situ self-evolving memory construction, which synthesizes probe QA pairs, verifies the current memory, and converts failures into repair actions before the memory is finalized. Extensive experiments on LoCoMo show that MemMA consistently outperforms existing baselines across multiple LLM backbones and improves three different storage backends in a plug-and-play manner. Our code is publicly available at https://github.com/ventr1c/memma.