Grafiek van Vaardigheden: Afhankelijkheidsbewuste Structurele Retrieval voor Massale Agentvaardigheden

Samenvatting

Het gebruik van vaardigheden is een kernonderdeel geworden van moderne agentsystemen en kan het vermogen van agents om complexe taken te volbrengen aanzienlijk verbeteren. In realistische omgevingen, waar agents talloze persoonlijke applicaties, webbrowsers en andere omgevingsinterfaces moeten monitoren en ermee moeten interacteren, kunnen vaardigheidsbibliotheken uitgroeien tot duizenden herbruikbare vaardigheden. Het opschalen naar grotere vaardigheidsverzamelingen brengt twee belangrijke uitdagingen met zich mee. Tenelijk belast het laden van de volledige set de contextruimte tot aan de limiet, wat leidt tot hogere tokenkosten, hallucinaties en latentie. In dit artikel presenteren wij Graph of Skills (GoS), een structurele retrievallaag tijdens de inferentie voor grote vaardigheidsbibliotheken. GoS construeert offline een uitvoerbare vaardigheidsgrafiek uit vaardigheidspakketten, en haalt tijdens de inferentie een begrensde, afhankelijkheidsbewuste vaardigheidsbundel op via hybride semantisch-lexicale seeding, omgekeerd-gewogen Gepersonaliseerde PageRank en context-begroting hydratatie. Op SkillsBench en ALFWorld verbetert GoS de gemiddelde beloning met 43,6% ten opzichte van de baseline met volledige vaardigheidslading, terwijl de input-tokens met 37,8% worden verminderd, en generaliseert het over drie modelfamilies: Claude Sonnet, GPT-5.2 Codex en MiniMax. Aanvullende ablatiestudies over vaardigheidsbibliotheken variërend van 200 tot 2.000 vaardigheden tonen verder aan dat GoS consistent beter presteert dan zowel volledige vaardigheidslading als eenvoudige vectorretrieval in het balanceren van beloning, tokenefficiëntie en uitvoeringstijd.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Grafiek van Vaardigheden: Afhankelijkheidsbewuste Structurele Retrieval voor Massale Agentvaardigheden

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Samenvatting

Support