SkillAdaptor: Zelf-aanpassende vaardigheden voor LLM-agenten op basis van trajecten

Samenvatting

Agenten van grote taalmodellen (LLM) vertrouwen steeds vaker op herbruikbare externe vaardigheden om langdurige interactieve taken op te lossen. Bestaande trainingsvrije vaardigheidsaanpassingspijplijnen werken vaardigheden doorgaans bij op basis van volledige trajecten of feedback op sessieniveau, wat leidt tot grove fouttoewijzing en vaak instabiele of te brede herzieningen oplevert. We stellen SkillAdaptor voor, een trainingsvrij raamwerk voor vaardigheidsaanpassing op stapniveau met expliciete fouttoewijzing, dat kan worden ingepast in agentharnassen van de OpenClaw-klasse. Bij een mislukt traject identificeert SkillAdaptor een eerste bruikbare foutstap, koppelt verantwoordelijkheid aan kandidaatvaardigheden en past gerichte updates toe onder expliciete acceptatiecontroles, terwijl het basismodel bevroren blijft. We evalueren op WebShop, PinchBench en Claw-Eval met Kimi-K2.5, GLM-5 en GPT-5.2. SkillAdaptor presteert beter dan de baselines zonder vaardigheden en met vaardigheidsaanpassing op alle drie de suites, met de grootste afzonderlijke metrische verbeteringen van +1,5 punten op PinchBench Gem. Score%, +1,8 op Claw-Eval Gem. Score en +1,7 op WebShop succespercentage. Deze resultaten geven aan dat toewijzing op stapniveau een stabieler en controleerbaar trainingsvrij vaardigheidsonderhoud ondersteunt. De code zal worden vrijgegeven op https://github.com/zjunlp/SkillAdaptor.

English

Large language model (LLM) agents increasingly rely on reusable external skills to solve long-horizon interactive tasks. Existing training-free skill adaptation pipelines usually update skills from full trajectories or session-level feedback, which makes failure attribution coarse and often produces unstable or overly broad revisions. We propose SkillAdaptor, a training-free step-level skill adaptation framework with explicit failure attribution, and it can plug into OpenClaw-class agent harnesses. Given a failed trajectory, SkillAdaptor identifies a first actionable fault step, links responsibility to candidate skills, and applies targeted updates under explicit acceptance checks while keeping the backbone frozen. We evaluate on WebShop, PinchBench, and Claw-Eval with Kimi-K2.5, GLM-5, and GPT-5.2. SkillAdaptor improves over no-skill and skill-adaptation baselines on all three suites, with the largest single-metric improvements of +1.5 points on PinchBench Avg Score%, +1.8 on Claw-Eval Avg Score, and +1.7 on WebShop success rate. These results indicate that step-level attribution supports more stable and auditable training-free skill maintenanceThe code will be released at https://github.com/zjunlp/SkillAdaptor..