SkillX: エージェント向けスキル知識ベースの自動構築
SkillX: Automatically Constructing Skill Knowledge Bases for Agents
April 6, 2026
著者: Chenxi Wang, Zhuoyun Yu, Xin Xie, Wuguannan Yao, Runnan Fang, Shuofei Qiao, Kexin Cao, Guozhou Zheng, Xiang Qi, Peng Zhang, Shumin Deng
cs.AI
要旨
経験から学習することは、高機能な大規模言語モデル(LLM)エージェントを構築する上で極めて重要である。しかし、主流の自己進化パラダイムは非効率的なままである。すなわち、エージェントは孤立して学習し、限られた経験から類似した行動を繰り返し「再発見」するため、探索の重複と汎化性能の低下を招く。この問題を解決するため、我々は**SkillX**を提案する。これは、エージェントや環境を跨いで再利用可能なプラグアンドプレイ型スキル知識ベースを構築するための完全自動化フレームワークである。
SkillXは、以下に述べる3つの相補的な革新技術に基づく完全自動化パイプラインで動作する。(i) **マルチレベルスキル設計**:生の行動軌跡を、戦略的計画、機能的スキル、原子スキルという3層構造に蒸留する。(ii) **反復的スキル改良**:実行フィードバックに基づいてスキルを自動的に修正し、ライブラリの品質を継続的に向上させる。(iii) **探索的スキル拡張**:新規スキルを積極的に生成・検証し、初期訓練データを超えた網羅性を拡大する。
強力な基盤エージェント(GLM-4.6)を用いて、我々は再利用可能なスキルライブラリを自動構築し、AppWorld、BFCL-v3、τ^2-Benchといった難易度の高い長期的でユーザー対話型のベンチマークにおいて、その転移性を評価した。実験結果から、SkillXによって構築されたスキル知識ベース(SkillKB)を、より弱い基盤エージェントに組み込むことで、タスクの成功率と実行効率が一貫して向上することが示された。これは、汎化可能なエージェント学習において、構造化され階層化された経験表現が重要であることを裏付けている。コードは近日中にhttps://github.com/zjunlp/SkillX で公開予定である。
English
Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.