SkillX: Automatische Erstellung von Fähigkeitswissensbasen für Agenten

Zusammenfassung

Das Lernen aus Erfahrung ist entscheidend für die Entwicklung leistungsfähiger Agenten auf Basis großer Sprachmodelle (LLM), doch bestehende selbstoptimierende Paradigmen bleiben ineffizient: Agenten lernen isoliert, entdecken wiederholt ähnliche Verhaltensweisen aus begrenzten Erfahrungen neu, was zu redundanter Exploration und schlechter Generalisierung führt. Um dieses Problem zu lösen, stellen wir SkillX vor, ein vollautomatisiertes Framework zur Erstellung einer Plug-and-Play-Fähigkeitswissensbasis, die übergreifend für Agenten und Umgebungen wiederverwendet werden kann. SkillX operiert durch eine vollautomatisierte Pipeline, die auf drei synergetischen Innovationen aufbaut: (i) Multi-Level-Fähigkeiten-Design, das Roh-Trajektorien in eine dreistufige Hierarchie aus strategischen Plänen, funktionalen Fähigkeiten und atomaren Fähigkeiten destilliert; (ii) Iterative Fähigkeiten-Verfeinerung, die Fähigkeiten automatisch auf Basis von Ausführungsfeedback überarbeitet, um die Bibliotheksqualität kontinuierlich zu verbessern; und (iii) Explorative Fähigkeiten-Erweiterung, die proaktiv neue Fähigkeiten generiert und validiert, um die Abdeckung über die ursprünglichen Trainingsdaten hinaus zu erweitern. Mit einem starken Basis-Agenten (GLM-4.6) bauen wir automatisch eine wiederverwendbare Fähigkeiten-Bibliothek auf und evaluieren ihre Übertragbarkeit auf anspruchsvolle, langfristige, benutzerinteraktive Benchmarks, darunter AppWorld, BFCL-v3 und τ^2-Bench. Experimente zeigen, dass SkillKB die Aufgabenerfüllung und Ausführungseffizienz verbessert, wenn es in schwächere Basis-Agenten integriert wird, was die Bedeutung strukturierter, hierarchischer Erfahrungsrepräsentationen für generalisierbares Agenten-Lernen unterstreicht. Unser Code wird demnächst unter https://github.com/zjunlp/SkillX öffentlich verfügbar sein.

English

Learning from experience is critical for building capable large language model (LLM) agents, yet prevailing self-evolving paradigms remain inefficient: agents learn in isolation, repeatedly rediscover similar behaviors from limited experience, resulting in redundant exploration and poor generalization. To address this problem, we propose SkillX, a fully automated framework for constructing a plug-and-play skill knowledge base that can be reused across agents and environments. SkillX operates through a fully automated pipeline built on three synergistic innovations: (i) Multi-Level Skills Design, which distills raw trajectories into three-tiered hierarchy of strategic plans, functional skills, and atomic skills; (ii) Iterative Skills Refinement, which automatically revises skills based on execution feedback to continuously improve library quality; and (iii) Exploratory Skills Expansion, which proactively generates and validates novel skills to expand coverage beyond seed training data. Using a strong backbone agent (GLM-4.6), we automatically build a reusable skill library and evaluate its transferability on challenging long-horizon, user-interactive benchmarks, including AppWorld, BFCL-v3, and τ^2-Bench. Experiments show that SkillKB consistently improves task success and execution efficiency when plugged into weaker base agents, highlighting the importance of structured, hierarchical experience representations for generalizable agent learning. Our code will be publicly available soon at https://github.com/zjunlp/SkillX.

SkillX: Automatische Erstellung von Fähigkeitswissensbasen für Agenten

SkillX: Automatically Constructing Skill Knowledge Bases for Agents

Zusammenfassung

Support