Memento-Skills: Агенты, создающие агентов

Аннотация

Мы представляем Memento-Skills — универсальную систему агентов на основе LLM с возможностью непрерывного обучения, которая функционирует как агент, проектирующий других агентов: она автономно создает, адаптирует и улучшает агентов для конкретных задач на основе опыта. Система построена на основе фреймворка обучения с подкреплением с запоминанием состояний, где переиспользуемые навыки (хранящиеся в виде структурированных markdown-файлов) служат постоянной, эволюционирующей памятью. Эти навыки кодируют как поведение, так и контекст, позволяя агенту переносить знания между взаимодействиями. Начиная с простых элементарных навыков (таких как веб-поиск и операции в терминале), агент непрерывно совершенствуется с помощью механизма рефлексивного обучения Read–Write, представленного в Memento~2~wang2025memento2. На фазе чтения маршрутизатор навыков с обучаемым поведением выбирает наиболее релевантный навык в зависимости от текущего состояния; на фазе записи агент обновляет и расширяет свою библиотеку навыков на основе нового опыта. Такая замкнутая архитектура позволяет осуществлять непрерывное обучение без обновления параметров LLM, поскольку вся адаптация реализуется через эволюцию внешних навыков и промптов. В отличие от предыдущих подходов, основанных на агентах, спроектированных человеком, Memento-Skills позволяет универсальному агенту проектировать агентов для новых задач от начала до конца. Благодаря итеративной генерации и уточнению навыков система постепенно улучшает собственные возможности. Эксперименты на бенчмарке General AI Assistants и тесте Humanity's Last Exam демонстрируют устойчивый прогресс, показывая относительное улучшение общей точности на 26,2% и 116,2% соответственно. Код доступен по адресу https://github.com/Memento-Teams/Memento-Skills.

English

We introduce Memento-Skills, a generalist, continually-learnable LLM agent system that functions as an agent-designing agent: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with stateful prompts, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the Read--Write Reflective Learning mechanism introduced in Memento~2~wang2025memento2. In the read phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the write phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables continual learning without updating LLM parameters, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to design agents end-to-end for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the General AI Assistants benchmark and Humanity's Last Exam demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.

Memento-Skills: Агенты, создающие агентов

Memento-Skills: Let Agents Design Agents

Аннотация

Support