SkillX: Construção Automática de Bases de Conhecimento de Habilidades para Agentes

Resumo

A aprendizagem a partir da experiência é crucial para a construção de agentes de modelos de linguagem grandes (LLM) capazes, no entanto, os paradigmas de auto-evolução predominantes permanecem ineficientes: os agentes aprendem de forma isolada, redescobrindo repetidamente comportamentos semelhantes a partir de experiências limitadas, resultando em exploração redundante e baixa generalização. Para resolver este problema, propomos o **SkillX**, um quadro totalmente automatizado para construir uma base de conhecimento de habilidades "plug-and-play" que pode ser reutilizada entre agentes e ambientes. O SkillX opera através de um *pipeline* totalmente automatizado construído sobre três inovações sinérgicas: (i) **Design de Habilidades Multi-Nível**, que destila trajetórias brutas numa hierarquia de três níveis: planos estratégicos, habilidades funcionais e habilidades atómicas; (ii) **Refinamento Iterativo de Habilidades**, que revê automaticamente as habilidades com base no *feedback* de execução para melhorar continuamente a qualidade da biblioteca; (iii) **Expansão Exploratória de Habilidades**, que gera e valia proativamente novas habilidades para expandir a cobertura para além dos dados de treino iniciais. Utilizando um agente base robusto (GLM-4.6), construímos automaticamente uma biblioteca de habilidades reutilizável e avaliamos a sua transferibilidade em *benchmarks* desafiadores de longo horizonte e interação com o utilizador, incluindo AppWorld, BFCL-v3 e τ²-Bench. As experiências mostram que a SkillKB melhora consistentemente o sucesso da tarefa e a eficiência de execução quando integrada em agentes base mais fracos, destacando a importância de representações de experiência estruturadas e hierárquicas para a aprendizagem generalizável de agentes. O nosso código estará publicamente disponível em breve em https://github.com/zjunlp/SkillX.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.