ChatPaper.aiChatPaper

Memento-Skills: 에이전트가 에이전트를 설계하게 하기

Memento-Skills: Let Agents Design Agents

March 19, 2026
저자: Huichi Zhou, Siyuan Guo, Anjie Liu, Zhongwei Yu, Ziqin Gong, Bowen Zhao, Zhixun Chen, Menglong Zhang, Yihang Chen, Jinsong Li, Runyu Yang, Qiangbin Liu, Xinlei Yu, Jianmin Zhou, Na Wang, Chunyang Sun, Jun Wang
cs.AI

초록

우리는 에이전트 설계 에이전트 역할을 하는 범용적이며 지속적 학습이 가능한 LLM 에이전트 시스템인 Memento-Skills를 소개한다. 이 시스템은 경험을 통해 작업별 에이전트를 자율적으로 구축, 적응 및 개선한다. 이 시스템은 상태 저장 프롬프트를 사용하는 메모리 기반 강화 학습 프레임워크 위에 구축되었으며, 재사용 가능한 스킬(구조화된 마크다운 파일로 저장됨)이 지속적이고 진화하는 메모리 역할을 한다. 이러한 스킬은 행동과 맥락을 모두 인코딩하여 에이전트가 상호작용을 거쳐 지식을 이어나갈 수 있도록 한다. 웹 검색 및 터미널 작업과 같은 단순한 기초 스킬에서 시작하여, 에이전트는 Memento~2~wang2025memento2에서 소개된 읽기-쓰기 반성 학습 메커니즘을 통해 지속적으로 개선된다. 읽기 단계에서는 행동 훈련이 가능한 스킬 라우터가 현재 상태 저장 프롬프트를 조건으로 가장 관련성 높은 스킬을 선택한다. 쓰기 단계에서는 에이전트가 새로운 경험을 바탕으로 자신의 스킬 라이브러리를 업데이트하고 확장한다. 이러한 폐쇄형 루프 설계는 모든 적응이 외부화된 스킬과 프롬프트의 진화를 통해 실현되므로 LLM 매개변수를 업데이트하지 않고도 지속적 학습을 가능하게 한다. 사람이 설계한 에이전트에 의존하는 기존 접근법과 달리, Memento-Skills는 범용 에이전트가 새로운 작업을 위해 처음부터 끝까지 에이전트를 설계할 수 있게 한다. 반복적인 스킬 생성 및 정제를 통해 시스템은 자신의 능력을 점진적으로 향상시킨다. General AI Assistants 벤치마크와 Humanity's Last Exam에 대한 실험은 지속적인 성능 향상을 보여주었으며, 각각 전체 정확도에서 26.2%, 116.2%의 상대적 개선을 달성했다. 코드는 https://github.com/Memento-Teams/Memento-Skills에서 확인할 수 있다.
English
We introduce Memento-Skills, a generalist, continually-learnable LLM agent system that functions as an agent-designing agent: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with stateful prompts, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the Read--Write Reflective Learning mechanism introduced in Memento~2~wang2025memento2. In the read phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the write phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables continual learning without updating LLM parameters, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to design agents end-to-end for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the General AI Assistants benchmark and Humanity's Last Exam demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.
PDF231March 21, 2026