Memp : Exploration de la mémoire procédurale des agents

papers.abstract

Les agents basés sur les grands modèles de langage (LLMs) excellent dans des tâches variées, mais ils souffrent d'une mémoire procédurale fragile, soit conçue manuellement, soit intégrée dans des paramètres statiques. Dans ce travail, nous explorons des stratégies pour doter les agents d'une mémoire procédurale apprenable, actualisable et pérenne. Nous proposons Memp, qui condense les trajectoires passées des agents en instructions détaillées, étape par étape, ainsi qu'en abstractions de plus haut niveau, semblables à des scripts, et nous étudions l'impact de différentes stratégies pour la construction, la récupération et la mise à jour de la mémoire procédurale. Couplé à un régime dynamique qui met continuellement à jour, corrige et déprécie son contenu, ce référentiel évolue en synchronie avec les nouvelles expériences. L'évaluation empirique sur TravelPlanner et ALFWorld montre qu'à mesure que le référentiel de mémoire est affiné, les agents atteignent des taux de réussite progressivement plus élevés et une plus grande efficacité sur des tâches analogues. De plus, la mémoire procédurale construite à partir d'un modèle plus performant conserve sa valeur : migrer cette mémoire vers un modèle plus faible entraîne des gains substantiels en performance.

English

Large Language Models (LLMs) based agents excel at diverse tasks, yet they suffer from brittle procedural memory that is manually engineered or entangled in static parameters. In this work, we investigate strategies to endow agents with a learnable, updatable, and lifelong procedural memory. We propose Memp that distills past agent trajectories into both fine-grained, step-by-step instructions and higher-level, script-like abstractions, and explore the impact of different strategies for Build, Retrieval, and Update of procedural memory. Coupled with a dynamic regimen that continuously updates, corrects, and deprecates its contents, this repository evolves in lockstep with new experience. Empirical evaluation on TravelPlanner and ALFWorld shows that as the memory repository is refined, agents achieve steadily higher success rates and greater efficiency on analogous tasks. Moreover, procedural memory built from a stronger model retains its value: migrating the procedural memory to a weaker model yields substantial performance gains.

Memp : Exploration de la mémoire procédurale des agents

Memp: Exploring Agent Procedural Memory

papers.abstract

Support