SkillX : Construction automatique de bases de connaissances de compétences pour les agents

Résumé

L’apprentissage par l’expérience est essentiel pour développer des agents de grands modèles de langage (LLM) performants. Pourtant, les paradigmes d’auto-évolution actuels restent inefficaces : les agents apprennent de manière isolée, redécouvrant sans cesse des comportements similaires à partir d’une expérience limitée, ce qui entraîne une exploration redondante et une faible généralisation. Pour résoudre ce problème, nous proposons SkillX, un cadre entièrement automatisé pour construire une base de connaissances de compétences prêtes à l’emploi, réutilisable entre agents et environnements. SkillX fonctionne via un pipeline automatisé reposant sur trois innovations synergiques : (i) la Conception de Compétences Multi-Niveaux, qui distille les trajectoires brutes en une hiérarchie à trois niveaux (plans stratégiques, compétences fonctionnelles et compétences atomiques) ; (ii) le Raffinement Itératif des Compétences, qui révise automatiquement les compétences sur la base des retours d’exécution pour améliorer continuellement la qualité de la bibliothèque ; et (iii) l’Expansion Exploratoire des Compétences, qui génère et valide de manière proactive de nouvelles compétences pour étendre la couverture au-delà des données d’entraînement initiales. En utilisant un agent de base performant (GLM-4.6), nous construisons automatiquement une bibliothèque de compétences réutilisable et évaluons sa transférabilité sur des benchmarks exigeants de tâches à long terme et interactives, notamment AppWorld, BFCL-v3 et τ²-Bench. Les expériences montrent que SkillX améliore constamment le succès des tâches et l’efficacité d’exécution lorsqu’il est intégré à des agents de base moins performants, soulignant l’importance des représentations d’expérience structurées et hiérarchisées pour un apprentissage généralisable des agents. Notre code sera bientôt disponible publiquement à l’adresse : https://github.com/zjunlp/SkillX.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.

SkillX : Construction automatique de bases de connaissances de compétences pour les agents

SkillX: Automatically Constructing Skill Knowledge Bases for Agents

Résumé

Support