SkillAdaptor : Compétences auto-adaptatives pour agents LLM à partir de trajectoires

Résumé

Les agents basés sur de grands modèles de langage (LLM) s'appuient de plus en plus sur des compétences externes réutilisables pour résoudre des tâches interactives à long horizon. Les pipelines d'adaptation des compétences sans entraînement existants mettent généralement à jour les compétences à partir de trajectoires complètes ou de retours au niveau de la session, ce qui rend l'attribution des échecs grossière et produit souvent des révisions instables ou trop larges. Nous proposons SkillAdaptor, un cadre d'adaptation des compétences sans entraînement, au niveau des étapes, avec attribution explicite des échecs, qui peut s'intégrer dans les harnais d'agents de type OpenClaw. Étant donné une trajectoire échouée, SkillAdaptor identifie une première étape d'action défaillante, relie la responsabilité aux compétences candidates, et applique des mises à jour ciblées sous des contrôles d'acceptation explicites, tout en maintenant le backbone figé. Nous évaluons sur WebShop, PinchBench et Claw-Eval avec Kimi-K2.5, GLM-5 et GPT-5.2. SkillAdaptor améliore les références sans compétence et avec adaptation de compétence sur les trois suites, avec les plus grandes améliorations sur un seul indicateur de +1,5 point sur le score moyen % de PinchBench, +1,8 sur le score moyen de Claw-Eval, et +1,7 sur le taux de réussite de WebShop. Ces résultats indiquent que l'attribution au niveau des étapes permet une maintenance des compétences sans entraînement plus stable et vérifiable. Le code sera publié à l'adresse https://github.com/zjunlp/SkillAdaptor.

English

Large language model (LLM) agents increasingly rely on reusable external skills to solve long-horizon interactive tasks. Existing training-free skill adaptation pipelines usually update skills from full trajectories or session-level feedback, which makes failure attribution coarse and often produces unstable or overly broad revisions. We propose SkillAdaptor, a training-free step-level skill adaptation framework with explicit failure attribution, and it can plug into OpenClaw-class agent harnesses. Given a failed trajectory, SkillAdaptor identifies a first actionable fault step, links responsibility to candidate skills, and applies targeted updates under explicit acceptance checks while keeping the backbone frozen. We evaluate on WebShop, PinchBench, and Claw-Eval with Kimi-K2.5, GLM-5, and GPT-5.2. SkillAdaptor improves over no-skill and skill-adaptation baselines on all three suites, with the largest single-metric improvements of +1.5 points on PinchBench Avg Score%, +1.8 on Claw-Eval Avg Score, and +1.7 on WebShop success rate. These results indicate that step-level attribution supports more stable and auditable training-free skill maintenanceThe code will be released at https://github.com/zjunlp/SkillAdaptor..