SkillX: Automatisch opbouwen van vaardighedenkennisbanken voor agents

Samenvatting

Leren uit ervaring is cruciaal voor het ontwikkelen van krachtige grote-taalmodelagenten (LLM-agenten), maar de heersende zelf-evoluerende paradigma's blijven inefficiënt: agenten leren in isolatie, ontdekken herhaaldelijk vergelijkbaar gedrag op basis van beperkte ervaring, wat leidt tot redundante verkenning en slechte generalisatie. Om dit probleem aan te pakken, stellen we SkillX voor, een volledig geautomatiseerd raamwerk voor het opbouwen van een plug-and-play vaardigheidskennisbank die herbruikbaar is across agenten en omgevingen. SkillX werkt via een volledig geautomatiseerde pijplijn gebouwd op drie synergetische innovaties: (i) Multi-Level Vaardigheden Ontwerp, dat ruwe trajecten destilleert tot een drielaagse hiërarchie van strategische plannen, functionele vaardigheden en atomische vaardigheden; (ii) Iteratieve Vaardigheden Verfijning, dat vaardigheden automatisch reviseert op basis van uitvoeringsfeedback om de kwaliteit van de bibliotheek continu te verbeteren; en (iii) Explorerende Vaardigheden Uitbreiding, dat proactief nieuwe vaardigheden genereert en valideert om de dekking voorbij de initiële trainingsgegevens uit te breiden. Met behulp van een sterke backbone-agent (GLM-4.6) bouwen we automatisch een herbruikbare vaardighedenbibliotheek en evalueren we de overdraagbaarheid ervan op uitdagende benchmarks met een lange tijds horizon en gebruikersinteractie, waaronder AppWorld, BFCL-v3 en τ²-Bench. Experimenten tonen aan dat SkillKB consistent de taaksucces en uitvoeringsefficiëntie verbetert wanneer het wordt ingeplugd in zwakkere basisagenten, wat het belang benadrukt van gestructureerde, hiërarchische ervaringsrepresentaties voor generaliseerbaar agent-leren. Onze code zal binnenkort openbaar beschikbaar zijn op https://github.com/zjunlp/SkillX.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.

SkillX: Automatisch opbouwen van vaardighedenkennisbanken voor agents

SkillX: Automatically Constructing Skill Knowledge Bases for Agents

Samenvatting

Support