Memento-Skills: Que los Agentes Diseñen Agentes

Resumen

Presentamos Memento-Skills, un sistema de agente LLM generalista y de aprendizaje continuo que funciona como un agente diseñador de agentes: construye, adapta y mejora de forma autónoma agentes específicos para tareas mediante la experiencia. El sistema se basa en un marco de aprendizaje por refuerzo basado en memoria con prompts con estado, donde habilidades reutilizables (almacenadas como archivos markdown estructurados) sirven como memoria persistente y en evolución. Estas habilidades codifican tanto el comportamiento como el contexto, permitiendo al agente trasladar conocimiento a través de las interacciones. Partiendo de habilidades elementales simples (como la búsqueda web y las operaciones de terminal), el agente mejora continuamente mediante el mecanismo de Aprendizaje Reflexivo de Lectura-Escritura introducido en Memento~2~wang2025memento2. En la fase de lectura, un enrutador de habilidades entrenable para el comportamiento selecciona la habilidad más relevante condicionada por el prompt con estado actual; en la fase de escritura, el agente actualiza y expande su biblioteca de habilidades basándose en nuevas experiencias. Este diseño de bucle cerrado permite el aprendizaje continuo sin actualizar los parámetros del LLM, ya que toda la adaptación se realiza mediante la evolución de habilidades y prompts externalizados. A diferencia de enfoques anteriores que dependen de agentes diseñados por humanos, Memento-Skills permite que un agente generalista diseñe agentes de extremo a extremo para nuevas tareas. A través de la generación y refinamiento iterativos de habilidades, el sistema mejora progresivamente sus propias capacidades. Los experimentos en el benchmark General AI Assistants y en Humanity's Last Exam demuestran mejoras sostenidas, logrando mejoras relativas en la precisión general del 26.2 % y 116.2 %, respectivamente. El código está disponible en https://github.com/Memento-Teams/Memento-Skills.

English

We introduce Memento-Skills, a generalist, continually-learnable LLM agent system that functions as an agent-designing agent: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with stateful prompts, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the Read--Write Reflective Learning mechanism introduced in Memento~2~wang2025memento2. In the read phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the write phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables continual learning without updating LLM parameters, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to design agents end-to-end for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the General AI Assistants benchmark and Humanity's Last Exam demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.

Memento-Skills: Que los Agentes Diseñen Agentes

Memento-Skills: Let Agents Design Agents

Resumen

Support