ChatPaper.aiChatPaper

SkillAdaptor: 궤적으로부터 LLM 에이전트를 위한 자기 적응 스킬

SkillAdaptor: Self-Adapting Skills for LLM Agents from Trajectories

May 31, 2026
저자: Zhuoyun Yu, Xin Xie, Wuguannan Yao, Chenxi Wang, Lei Liang, Xiang Qi, Shumin Deng
cs.AI

초록

대규모 언어 모델(LLM) 에이전트는 점차적으로 재사용 가능한 외부 스킬에 의존하여 장기 대화형 작업을 해결한다. 기존의 훈련 없는 스킬 적응 파이프라인은 일반적으로 전체 궤적(trajectory) 또는 세션 수준의 피드백으로부터 스킬을 갱신하는데, 이는 실패 귀인을 거칠게 만들고 종종 불안정하거나 지나치게 광범위한 수정을 초래한다. 본 연구에서는 명시적인 실패 귀인을 갖춘 훈련 없는 단계 수준 스킬 적응 프레임워크인 SkillAdaptor를 제안하며, 이는 OpenClaw-class 에이전트 하니스(harness)에 플러그인 형태로 적용 가능하다. 실패한 궤적이 주어지면 SkillAdaptor는 첫 번째로 실행 가능한 오류 단계를 식별하고, 해당 책임을 후보 스킬에 연결하며, 백본(backbone)은 고정된 상태에서 명시적인 수용 검사 조건 하에 목표 지향적 갱신을 적용한다. WebShop, PinchBench 및 Claw-Eval에서 Kimi-K2.5, GLM-5, GPT-5.2를 사용하여 평가를 수행했다. SkillAdaptor는 세 가지 평가 스위트 모두에서 스킬 미사용 및 스킬 적응 기준선 대비 성능을 향상시켰으며, 가장 큰 단일 지표 개선으로 PinchBench Avg Score%에서 +1.5포인트, Claw-Eval Avg Score에서 +1.8, WebShop 성공률에서 +1.7을 기록했다. 이러한 결과는 단계 수준의 귀인이 보다 안정적이고 감사 가능한 훈련 없는 스킬 유지(maintenance)를 지원함을 시사한다. 코드는 https://github.com/zjunlp/SkillAdaptor에서 공개될 예정이다.
English
Large language model (LLM) agents increasingly rely on reusable external skills to solve long-horizon interactive tasks. Existing training-free skill adaptation pipelines usually update skills from full trajectories or session-level feedback, which makes failure attribution coarse and often produces unstable or overly broad revisions. We propose SkillAdaptor, a training-free step-level skill adaptation framework with explicit failure attribution, and it can plug into OpenClaw-class agent harnesses. Given a failed trajectory, SkillAdaptor identifies a first actionable fault step, links responsibility to candidate skills, and applies targeted updates under explicit acceptance checks while keeping the backbone frozen. We evaluate on WebShop, PinchBench, and Claw-Eval with Kimi-K2.5, GLM-5, and GPT-5.2. SkillAdaptor improves over no-skill and skill-adaptation baselines on all three suites, with the largest single-metric improvements of +1.5 points on PinchBench Avg Score%, +1.8 on Claw-Eval Avg Score, and +1.7 on WebShop success rate. These results indicate that step-level attribution supports more stable and auditable training-free skill maintenanceThe code will be released at https://github.com/zjunlp/SkillAdaptor..