Memento-Skills: Deixe os Agentes Projetarem Agentes

Resumo

Apresentamos o Memento-Skills, um sistema de agente LLM generalista e de aprendizado contínuo que funciona como um agente projetador de agentes: ele constrói, adapta e melhora agentes específicos para tarefas de forma autônoma por meio da experiência. O sistema é construído sobre uma estrutura de aprendizado por reforço baseada em memória com *prompts* com estado, onde habilidades reutilizáveis (armazenadas como arquivos estruturados em markdown) servem como memória persistente e em evolução. Essas habilidades codificam tanto o comportamento quanto o contexto, permitindo que o agente transporte conhecimento através das interações. Partindo de habilidades elementares simples (como pesquisa na Web e operações de terminal), o agente melhora continuamente por meio do mecanismo de Aprendizado Reflexivo de Leitura-Gravação introduzido no Memento~2~wang2025memento2. Na fase de leitura, um roteador de habilidades treinável para comportamento seleciona a habilidade mais relevante condicionada ao *prompt* com estado atual; na fase de gravação, o agente atualiza e expande sua biblioteca de habilidades com base na nova experiência. Este projeto em *loop* fechado permite o aprendizado contínuo sem a atualização dos parâmetros do LLM, uma vez que toda a adaptação é realizada através da evolução das habilidades e *prompts* externalizados. Diferentemente de abordagens anteriores que dependem de agentes projetados por humanos, o Memento-Skills permite que um agente generalista projete agentes de ponta a ponta para novas tarefas. Por meio da geração e refinamento iterativos de habilidades, o sistema melhora progressivamente suas próprias capacidades. Experimentos no benchmark *General AI Assistants* e no *Humanity's Last Exam* demonstram ganhos sustentados, alcançando melhorias relativas de 26,2% e 116,2% na precisão geral, respectivamente. O código está disponível em https://github.com/Memento-Teams/Memento-Skills.

English

We introduce Memento-Skills, a generalist, continually-learnable LLM agent system that functions as an agent-designing agent: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with stateful prompts, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the Read--Write Reflective Learning mechanism introduced in Memento~2~wang2025memento2. In the read phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the write phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables continual learning without updating LLM parameters, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to design agents end-to-end for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the General AI Assistants benchmark and Humanity's Last Exam demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.