SkillX: Construcción Automática de Bases de Conocimiento de Habilidades para Agentes

Resumen

El aprendizaje a partir de la experiencia es fundamental para construir agentes de modelos de lenguaje grande (LLM) capaces, sin embargo, los paradigmas de auto-evolución predominantes siguen siendo ineficientes: los agentes aprenden de forma aislada, redescubriendo repetidamente comportamientos similares a partir de una experiencia limitada, lo que resulta en una exploración redundante y una pobre generalización. Para abordar este problema, proponemos SkillX, un marco completamente automatizado para construir una base de conocimiento de habilidades "plug-and-play" que puede reutilizarse en diferentes agentes y entornos. SkillX opera mediante un pipeline totalmente automatizado basado en tres innovaciones sinérgicas: (i) Diseño de Habilidades Multi-Nivel, que destila las trayectorias brutas en una jerarquía de tres niveles que incluye planes estratégicos, habilidades funcionales y habilidades atómicas; (ii) Refinamiento Iterativo de Habilidades, que revisa automáticamente las habilidades basándose en la retroalimentación de la ejecución para mejorar continuamente la calidad de la biblioteca; y (iii) Expansión Exploratoria de Habilidades, que genera y valida proactivamente habilidades novedosas para ampliar la cobertura más allá de los datos de entrenamiento iniciales. Utilizando un agente base robusto (GLM-4.6), construimos automáticamente una biblioteca de habilidades reutilizable y evaluamos su transferibilidad en puntos de referencia desafiantes de horizonte largo e interactivos para el usuario, como AppWorld, BFCL-v3 y τ²-Bench. Los experimentos muestran que SkillKB mejora consistentemente el éxito en las tareas y la eficiencia de ejecución cuando se integra en agentes base más débiles, destacando la importancia de las representaciones de experiencia estructuradas y jerárquicas para el aprendizaje generalizable de agentes. Nuestro código estará disponible públicamente próximamente en https://github.com/zjunlp/SkillX.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.

SkillX: Construcción Automática de Bases de Conocimiento de Habilidades para Agentes

SkillX: Automatically Constructing Skill Knowledge Bases for Agents

Resumen

Support