Grafo delle Competenze: Recupero Strutturale con Consapevolezza delle Dipendenze per Competenze Massive degli Agenti

Abstract

L'utilizzo di competenze (skill) è diventato un componente fondamentale dei moderni sistemi agenti e può migliorare sostanzialmente la capacità degli agenti di completare compiti complessi. In scenari reali, dove gli agenti devono monitorare e interagire con numerose applicazioni personali, browser web e altre interfacce ambientali, le librerie di competenze possono scalare fino a migliaia di skill riutilizzabili. La scalabilità verso set di competenze più ampi introduce due sfide principali. In primo luogo, il caricamento dell'intero set di competenze satura la finestra di contesto, aumentando i costi in token, le allucinazioni e la latenza. In questo articolo, presentiamo Graph of Skills (GoS), un livello di retrieval strutturale in fase di inferenza per grandi librerie di competenze. GoS costruisce offline un grafo di skill eseguibile a partire da pacchetti di competenze; successivamente, in fase di inferenza, recupera un bundle di competenze delimitato e consapevole delle dipendenze attraverso: seeding ibrido semantico-lessicale, PageRank personalizzato a pesi inversi e idratazione con budget di contesto. Su SkillsBench e ALFWorld, GoS migliora la ricompensa media del 43,6% rispetto al baseline vanilla di caricamento completo delle skill, riducendo al contempo i token di input del 37,8%, e generalizza su tre famiglie di modelli: Claude Sonnet, GPT-5.2 Codex e MiniMax. Ulteriori studi di ablazione condotti su librerie di competenze che vanno da 200 a 2.000 skill dimostrano ulteriormente che GoS supera costantemente sia il caricamento vanilla delle skill che il semplice retrieval vettoriale nel bilanciare ricompensa, efficienza dei token e tempo di esecuzione.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Grafo delle Competenze: Recupero Strutturale con Consapevolezza delle Dipendenze per Competenze Massive degli Agenti

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Abstract

Support