SkillX: Costruzione Automatica di Basi di Conoscenza delle Competenze per Agenti

Abstract

L'apprendimento dall'esperienza è fondamentale per costruire agenti di grandi modelli linguistici (LLM) capaci, eppure i paradigmi di auto-evoluzione prevalenti rimangono inefficienti: gli agenti apprendono in isolamento, riscoprono ripetutamente comportamenti simili da esperienze limitate, con conseguente esplorazione ridondante e scarsa generalizzazione. Per affrontare questo problema, proponiamo SkillX, un framework completamente automatizzato per costruire una base di conoscenza di skill plug-and-play riutilizzabile tra agenti e ambienti. SkillX opera attraverso una pipeline completamente automatizzata basata su tre innovazioni sinergiche: (i) Progettazione di Skill Multi-Livello, che distilla le traiettorie grezze in una gerarchia a tre livelli di piani strategici, skill funzionali e skill atomiche; (ii) Raffinamento Iterativo delle Skill, che revisiona automaticamente le skill basandosi sul feedback di esecuzione per migliorare continuamente la qualità della libreria; e (iii) Espansione Esplorativa delle Skill, che genera e convalida proattivamente skill nuove per espandere la copertura oltre i dati di addestramento iniziali. Utilizzando un agente backbone robusto (GLM-4.6), costruiamo automaticamente una libreria di skill riutilizzabile e ne valutiamo la trasferibilità su benchmark impegnativi a lungo orizzonte e interattivi per l'utente, tra cui AppWorld, BFCL-v3 e τ^2-Bench. Gli esperimenti mostrano che SkillKB migliora costantemente il successo del compito e l'efficienza di esecuzione quando integrato in agenti base più deboli, evidenziando l'importanza di rappresentazioni dell'esperienza strutturate e gerarchiche per l'apprendimento generalizzabile degli agenti. Il nostro codice sarà presto pubblicamente disponibile su https://github.com/zjunlp/SkillX.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.

SkillX: Costruzione Automatica di Basi di Conoscenza delle Competenze per Agenti

SkillX: Automatically Constructing Skill Knowledge Bases for Agents

Abstract

Support