Gráfico de Competências: Recuperação Estrutural com Consciência de Dependências para Competências Maciças de Agentes

Resumo

A utilização de competências tornou-se um componente central dos sistemas de agentes modernos e pode melhorar substancialmente a capacidade dos agentes para concluir tarefas complexas. Em ambientes do mundo real, onde os agentes devem monitorizar e interagir com inúmeras aplicações pessoais, navegadores web e outras interfaces de ambiente, as bibliotecas de competências podem escalar para milhares de competências reutilizáveis. A escalabilidade para conjuntos de competências maiores introduz dois desafios principais. Primeiro, carregar o conjunto completo de competências satura a janela de contexto, aumentando os custos de *tokens*, alucinações e latência. Neste artigo, apresentamos o Grafo de Competências (GoS), uma camada de recuperação estrutural em tempo de inferência para grandes bibliotecas de competências. O GoS constrói offline um grafo de competências executável a partir de pacotes de competências e, no momento da inferência, recupera um pacote de competências delimitado e com consciência de dependências através de sementeamento híbrido semântico-léxico, *PageRank* Personalizado com Pesos Reversos e hidratação com orçamento de contexto. No SkillsBench e no ALFWorld, o GoS melhora a recompensa média em 43,6% em relação à linha de base simples de carregamento total de competências, enquanto reduz os *tokens* de entrada em 37,8%, e generaliza-se em três famílias de modelos: Claude Sonnet, GPT-5.2 Codex e MiniMax. Estudos de ablação adicionais em bibliotecas de competências que variam de 200 a 2.000 competências demonstram ainda que o GoS supera consistentemente tanto o carregamento simples de competências quanto a recuperação vetorial simples no equilíbrio entre recompensa, eficiência de *tokens* e tempo de execução.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Gráfico de Competências: Recuperação Estrutural com Consciência de Dependências para Competências Maciças de Agentes

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Resumo

Support