SkillClaw:エージェント型進化ツールによる集合的スキル進化
SkillClaw: Let Skills Evolve Collectively with Agentic Evolver
April 9, 2026
著者: Ziyu Ma, Shidong Yang, Yuxiang Ji, Xucong Wang, Yong Wang, Yiming Hu, Tongwen Huang, Xiangxiang Chu
cs.AI
要旨
大規模言語モデル(LLM)エージェント(OpenClawなど)は、複雑なタスクを実行するために再利用可能なスキルに依存しているが、これらのスキルはデプロイ後ほぼ静的なままである。その結果、類似のワークフロー、ツール利用パターン、失敗モードがユーザー間で繰り返し再発見され、システムが経験を通じて改善されることが妨げられている。異なるユーザーからのインタラクションは、スキルの有効性や失敗条件に関する相補的な信号を提供するが、既存システムにはこうした多様な経験を信頼性のあるスキル更新に変換するメカニズムが欠如している。これらの課題に対処するため、本論文ではマルチユーザーエージェントエコシステムにおける集合的スキル進化のフレームワーク「SkillClaw」を提案する。SkillClawは、ユーザー横断的かつ時間経過的なインタラクションをスキル改善の主要信号として扱い、利用中に生成される軌跡を継続的に集約する。自律進化モジュールが反復的な動作パターンを特定し、既存スキルの洗練や新機能による拡張を通じてスキルセットへの更新を実行する。更新されたスキルは共有リポジトリで維持され、ユーザー間で同期されるため、特定のコンテキストで発見された改善が追加のユーザー作業なしにシステム全体に伝播する。マルチユーザー経験を継続的なスキル更新に統合することで、SkillClawはユーザー横断的な知識伝達と累積的能力向上を実現し、WildClawBenchにおける実験では、限定的なインタラクションとフィードバックのみでQwen3-Maxの実世界エージェントシナリオにおける性能が大幅に向上することを示す。
English
Large language model (LLM) agents such as OpenClaw rely on reusable skills to perform complex tasks, yet these skills remain largely static after deployment. As a result, similar workflows, tool usage patterns, and failure modes are repeatedly rediscovered across users, preventing the system from improving with experience. While interactions from different users provide complementary signals about when a skill works or fails, existing systems lack a mechanism to convert such heterogeneous experiences into reliable skill updates. To address these issues, we present SkillClaw, a framework for collective skill evolution in multi-user agent ecosystems, which treats cross-user and over-time interactions as the primary signal for improving skills. SkillClaw continuously aggregates trajectories generated during use and processes them with an autonomous evolver, which identifies recurring behavioral patterns and translates them into updates to the skill set by refining existing skills or extending them with new capabilities. The resulting skills are maintained in a shared repository and synchronized across users, allowing improvements discovered in one context to propagate system-wide while requiring no additional effort from users. By integrating multi-user experience into ongoing skill updates, SkillClaw enables cross-user knowledge transfer and cumulative capability improvement, and experiments on WildClawBench show that limited interaction and feedback, it significantly improves the performance of Qwen3-Max in real-world agent scenarios.