ChatPaper.aiChatPaper

Memp: Explorando a Memória Procedural de Agentes

Memp: Exploring Agent Procedural Memory

August 8, 2025
Autores: Runnan Fang, Yuan Liang, Xiaobin Wang, Jialong Wu, Shuofei Qiao, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI

Resumo

Agentes baseados em Grandes Modelos de Linguagem (LLMs) se destacam em diversas tarefas, mas sofrem com uma memória procedural frágil que é manualmente projetada ou entrelaçada em parâmetros estáticos. Neste trabalho, investigamos estratégias para dotar agentes de uma memória procedural aprendível, atualizável e contínua. Propomos o Memp, que destila trajetórias passadas do agente em instruções detalhadas, passo a passo, e abstrações de nível superior, semelhantes a scripts, e exploramos o impacto de diferentes estratégias para Construção, Recuperação e Atualização da memória procedural. Acoplado a um regime dinâmico que atualiza, corrige e deprecia continuamente seus conteúdos, este repositório evolui em sincronia com novas experiências. A avaliação empírica em TravelPlanner e ALFWorld mostra que, à medida que o repositório de memória é refinado, os agentes alcançam taxas de sucesso cada vez maiores e maior eficiência em tarefas análogas. Além disso, a memória procedural construída a partir de um modelo mais forte mantém seu valor: migrar a memória procedural para um modelo mais fraco resulta em ganhos substanciais de desempenho.
English
Large Language Models (LLMs) based agents excel at diverse tasks, yet they suffer from brittle procedural memory that is manually engineered or entangled in static parameters. In this work, we investigate strategies to endow agents with a learnable, updatable, and lifelong procedural memory. We propose Memp that distills past agent trajectories into both fine-grained, step-by-step instructions and higher-level, script-like abstractions, and explore the impact of different strategies for Build, Retrieval, and Update of procedural memory. Coupled with a dynamic regimen that continuously updates, corrects, and deprecates its contents, this repository evolves in lockstep with new experience. Empirical evaluation on TravelPlanner and ALFWorld shows that as the memory repository is refined, agents achieve steadily higher success rates and greater efficiency on analogous tasks. Moreover, procedural memory built from a stronger model retains its value: migrating the procedural memory to a weaker model yields substantial performance gains.
PDF345August 11, 2025