MemMA: Координация цикла памяти посредством мультиагентного рассуждения и автономной самоэволюции

Аннотация

Агенты больших языковых моделей (LLM) с расширенной памятью используют внешние банки памяти для поддержки долгосрочных взаимодействий, однако большинство существующих систем рассматривают создание, поиск и использование памяти как изолированные подпроцессы. Это создает две взаимосвязанные проблемы: стратегическую слепоту на прямом пути цикла памяти, когда создание и поиск управляются локальными эвристиками вместо явного стратегического планирования, и разреженный, запаздывающий контроль на обратном пути, когда ошибки на последующих этапах редко приводят к непосредственному исправлению банка памяти. Для решения этих проблем мы предлагаем MemMA — модульную мультиагентную систему, координирующую цикл памяти по прямому и обратному путям. На прямом пути Мета-аналитик формирует структурированные указания, которые направляют Менеджера памяти при создании и ориентируют Систему запросов в процессе итеративного поиска. На обратном пути MemMA реализует самосовершенствующееся создание памяти in-situ, которое синтезирует тестовые вопросно-ответные пары, проверяет актуальное состояние памяти и преобразует ошибки в корректирующие действия до финализации памяти. Экстенсивные эксперименты на LoCoMo демонстрируют, что MemMA стабильно превосходит существующие базовые методы на различных архитектурах LLM и улучшает работу трех типов систем хранения в режиме plug-and-play. Наш код доступен по адресу https://github.com/ventr1c/memma.

English

Memory-augmented LLM agents maintain external memory banks to support long-horizon interaction, yet most existing systems treat construction, retrieval, and utilization as isolated subroutines. This creates two coupled challenges: strategic blindness on the forward path of the memory cycle, where construction and retrieval are driven by local heuristics rather than explicit strategic reasoning, and sparse, delayed supervision on the backward path, where downstream failures rarely translate into direct repairs of the memory bank. To address these challenges, we propose MemMA, a plug-and-play multi-agent framework that coordinates the memory cycle along both the forward and backward paths. On the forward path, a Meta-Thinker produces structured guidance that steers a Memory Manager during construction and directs a Query Reasoner during iterative retrieval. On the backward path, MemMA introduces in-situ self-evolving memory construction, which synthesizes probe QA pairs, verifies the current memory, and converts failures into repair actions before the memory is finalized. Extensive experiments on LoCoMo show that MemMA consistently outperforms existing baselines across multiple LLM backbones and improves three different storage backends in a plug-and-play manner. Our code is publicly available at https://github.com/ventr1c/memma.

MemMA: Координация цикла памяти посредством мультиагентного рассуждения и автономной самоэволюции

MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution

Аннотация

Support