Graphe de Compétences : Récupération Structurelle Consciente des Dépendances pour des Compétences Massives d'Agents

Résumé

L'utilisation de compétences est devenue un élément central des systèmes d'agents modernes et peut considérablement améliorer leur capacité à accomplir des tâches complexes. Dans des environnements réels, où les agents doivent surveiller et interagir avec de nombreuses applications personnelles, navigateurs web et autres interfaces, les bibliothèques de compétences peuvent atteindre des milliers d'aptitudes réutilisables. Le passage à des ensembles de compétences plus vastes introduit deux défis majeurs. Premièrement, le chargement de l'ensemble complet sature la fenêtre de contexte, ce qui augmente les coûts en tokens, les hallucinations et la latence. Dans cet article, nous présentons le Graphe de Compétences (GoS), une couche de récupération structurelle au moment de l'inférence pour les grandes bibliothèques de compétences. GoS construit hors ligne un graphe de compétences exécutable à partir de paquets de compétences, puis au moment de l'inférence, il récupère un ensemble de compétences limité et conscient des dépendances via un amorçage hybride sémantique-lexical, un PageRank personnalisé à pondération inversée et une hydratation adaptée au contexte budgétaire. Sur SkillsBench et ALFWorld, GoS amémente la récompense moyenne de 43,6 % par rapport à la base de référence de chargement complet standard, tout en réduisant les tokens d'entrée de 37,8 %, et généralise sur trois familles de modèles : Claude Sonnet, GPT-5.2 Codex et MiniMax. Des études d'ablation supplémentaires sur des bibliothèques de compétences allant de 200 à 2 000 compétences démontrent en outre que GoS surpasse constamment à la fois le chargement standard de compétences et la récupération vectorielle simple pour équilibrer la récompense, l'efficacité des tokens et le temps d'exécution.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Graphe de Compétences : Récupération Structurelle Consciente des Dépendances pour des Compétences Massives d'Agents

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Résumé

Support