ChatPaper.aiChatPaper

Memp: Исследование процедурной памяти агента

Memp: Exploring Agent Procedural Memory

August 8, 2025
Авторы: Runnan Fang, Yuan Liang, Xiaobin Wang, Jialong Wu, Shuofei Qiao, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Аннотация

Агенты на основе больших языковых моделей (LLM) демонстрируют высокие результаты в решении разнообразных задач, однако их процедурная память остается хрупкой, поскольку она либо создается вручную, либо заложена в статических параметрах. В данной работе мы исследуем стратегии, позволяющие наделить агентов обучаемой, обновляемой и долговременной процедурной памятью. Мы предлагаем подход Memp, который преобразует прошлые траектории агентов как в детализированные пошаговые инструкции, так и в более высокоуровневые, сценарные абстракции, и изучаем влияние различных стратегий на создание, извлечение и обновление процедурной памяти. В сочетании с динамическим режимом, который непрерывно обновляет, корректирует и устаревает свои данные, этот репозиторий развивается синхронно с новым опытом. Эмпирическая оценка на задачах TravelPlanner и ALFWorld показывает, что по мере уточнения репозитория памяти агенты достигают стабильно более высоких показателей успешности и большей эффективности в решении аналогичных задач. Более того, процедурная память, созданная на основе более мощной модели, сохраняет свою ценность: перенос этой памяти на менее мощную модель приводит к значительному улучшению производительности.
English
Large Language Models (LLMs) based agents excel at diverse tasks, yet they suffer from brittle procedural memory that is manually engineered or entangled in static parameters. In this work, we investigate strategies to endow agents with a learnable, updatable, and lifelong procedural memory. We propose Memp that distills past agent trajectories into both fine-grained, step-by-step instructions and higher-level, script-like abstractions, and explore the impact of different strategies for Build, Retrieval, and Update of procedural memory. Coupled with a dynamic regimen that continuously updates, corrects, and deprecates its contents, this repository evolves in lockstep with new experience. Empirical evaluation on TravelPlanner and ALFWorld shows that as the memory repository is refined, agents achieve steadily higher success rates and greater efficiency on analogous tasks. Moreover, procedural memory built from a stronger model retains its value: migrating the procedural memory to a weaker model yields substantial performance gains.
PDF274August 11, 2025