Grafo de Habilidades: Recuperación Estructural Consciente de Dependencias para Habilidades Masivas de Agentes

Resumen

El uso de habilidades se ha convertido en un componente central de los sistemas de agentes modernos y puede mejorar sustancialmente la capacidad de los agentes para completar tareas complejas. En entornos del mundo real, donde los agentes deben monitorear e interactuar con numerosas aplicaciones personales, navegadores web y otras interfaces de entorno, las bibliotecas de habilidades pueden escalar a miles de habilidades reutilizables. La escalabilidad a conjuntos de habilidades más grandes introduce dos desafíos clave. Primero, cargar el conjunto completo de habilidades satura la ventana de contexto, incrementando los costos de tokens, las alucinaciones y la latencia. En este artículo, presentamos Graph of Skills (GoS), una capa de recuperación estructural en tiempo de inferencia para grandes bibliotecas de habilidades. GoS construye offline un grafo de habilidades ejecutable a partir de paquetes de habilidades, y luego, en tiempo de inferencia, recupera un conjunto de habilidades acotado y consciente de las dependencias mediante siembra híbrida semántica-léxica, PageRank Personalizado con ponderación inversa e hidratación acotada por contexto. En SkillsBench y ALFWorld, GoS mejora la recompensa promedio en un 43.6% sobre la línea base simple de carga completa de habilidades, mientras reduce los tokens de entrada en un 37.8%, y generaliza a través de tres familias de modelos: Claude Sonnet, GPT-5.2 Codex y MiniMax. Estudios de ablación adicionales en bibliotecas de habilidades que van desde 200 hasta 2,000 habilidades demuestran además que GoS supera consistentemente tanto la carga simple de habilidades como la recuperación vectorial simple en el equilibrio entre recompensa, eficiencia de tokens y tiempo de ejecución.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Grafo de Habilidades: Recuperación Estructural Consciente de Dependencias para Habilidades Masivas de Agentes

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Resumen

Support