Memp: Verkenning van Procedureel Geheugen bij Agents
Memp: Exploring Agent Procedural Memory
August 8, 2025
Auteurs: Runnan Fang, Yuan Liang, Xiaobin Wang, Jialong Wu, Shuofei Qiao, Pengjun Xie, Fei Huang, Huajun Chen, Ningyu Zhang
cs.AI
Samenvatting
Agents gebaseerd op Large Language Models (LLMs) blinken uit in diverse taken, maar ze hebben last van broos procedureel geheugen dat handmatig is ontworpen of verstrengeld is in statische parameters. In dit werk onderzoeken we strategieën om agents te voorzien van een leerbaar, bijwerkbaar en levenslang procedureel geheugen. We stellen Memp voor, dat eerdere agenttrajecten destilleert tot zowel gedetailleerde, stap-voor-stap instructies als abstracties op hoger niveau, zoals scripts, en we verkennen de impact van verschillende strategieën voor het Bouwen, Ophalen en Bijwerken van procedureel geheugen. In combinatie met een dynamisch regime dat de inhoud continu bijwerkt, corrigeert en afschaft, evolueert deze repository gelijk op met nieuwe ervaringen. Empirische evaluatie op TravelPlanner en ALFWorld laat zien dat naarmate de geheugenrepository wordt verfijnd, agents gestaag hogere slagingspercentages en grotere efficiëntie behalen bij vergelijkbare taken. Bovendien behoudt procedureel geheugen dat is opgebouwd vanuit een sterker model zijn waarde: het migreren van het procedureel geheugen naar een zwakker model levert aanzienlijke prestatieverbeteringen op.
English
Large Language Models (LLMs) based agents excel at diverse tasks, yet they
suffer from brittle procedural memory that is manually engineered or entangled
in static parameters. In this work, we investigate strategies to endow agents
with a learnable, updatable, and lifelong procedural memory. We propose Memp
that distills past agent trajectories into both fine-grained, step-by-step
instructions and higher-level, script-like abstractions, and explore the impact
of different strategies for Build, Retrieval, and Update of procedural memory.
Coupled with a dynamic regimen that continuously updates, corrects, and
deprecates its contents, this repository evolves in lockstep with new
experience. Empirical evaluation on TravelPlanner and ALFWorld shows that as
the memory repository is refined, agents achieve steadily higher success rates
and greater efficiency on analogous tasks. Moreover, procedural memory built
from a stronger model retains its value: migrating the procedural memory to a
weaker model yields substantial performance gains.