SkillX: 에이전트를 위한 스킬 지식 베이스 자동 구축
SkillX: Automatically Constructing Skill Knowledge Bases for Agents
April 6, 2026
저자: Chenxi Wang, Zhuoyun Yu, Xin Xie, Wuguannan Yao, Runnan Fang, Shuofei Qiao, Kexin Cao, Guozhou Zheng, Xiang Qi, Peng Zhang, Shumin Deng
cs.AI
초록
경험 학습은 능력 있는 대규모 언어 모델(LLM) 에이전트 구축에 중요하지만, 기존의 자기 진화 패러다임은 비효율적으로 남아 있습니다: 에이전트는 고립되어 학습하며, 제한된 경험에서 유사한 행동을 반복적으로 재발견하여 중복 탐색과 낮은 일반화 성능을 초래합니다. 이러한 문제를 해결하기 위해 우리는 에이전트와 환경 간에 재사용 가능한 플러그 앤 플레이 스킬 지식 베이스를 구축하는 완전 자동화 프레임워크인 SkillX를 제안합니다. SkillX는 다음과 같은 세 가지 상호 보완적인 혁신 기술을 기반으로 구축된 완전 자동화 파이프라인으로 운영됩니다: (i) 전략적 계획, 기능적 스킬, 원자적 스킬의 3계층 계층 구조로 원본 궤적을 정제하는 다단계 스킬 설계; (ii) 실행 피드백을 기반으로 스킬을 자동 수정하여 라이브러리 품질을 지속적으로 향상시키는 반복적 스킬 정제; (iii) 시드 훈련 데이터를 넘어 커버리지를 확장하기 위해 새로운 스킬을 능동적으로 생성하고 검증하는 탐색적 스킬 확장. 강력한 백본 에이전트(GLM-4.6)를 사용하여 재사용 가능한 스킬 라이브러리를 자동 구축하고 AppWorld, BFCL-v3, τ^2-Bench를 포함한 도전적인 장기간 사용자 상호작용 벤치마크에서 이전 성능을 평가합니다. 실험 결과, SkillKB는 약한 기본 에이전트에 플러그인될 때 작업 성공률과 실행 효율성을 지속적으로 향상시키며, 일반화 가능한 에이전트 학습을 위한 구조화된 계층적 경험 표현의 중요성을 강조합니다. 우리의 코드는 https://github.com/zjunlp/SkillX에서 곧 공개될 예정입니다.
English
Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.