Граф навыков: структурный поиск с учетом зависимостей для массивов агентных навыков

Аннотация

Использование навыков стало ключевым компонентом современных агентных систем и может существенно повысить способность агентов выполнять сложные задачи. В реальных сценариях, где агенты должны отслеживать и взаимодействовать с многочисленными персональными приложениями, веб-браузерами и другими интерфейсами среды, библиотеки навыков могут масштабироваться до тысяч повторно используемых навыков. Масштабирование до больших наборов навыков порождает две основные проблемы. Во-первых, загрузка полного набора навыков насыщает контекстное окно, приводя к росту токенных затрат, галлюцинациям и задержкам. В данной статье мы представляем Граф Навыков (GoS) — уровень структурного поиска во время вывода для больших библиотек навыков. GoS строит исполняемый граф навыков оффлайн из пакетов навыков, а во время вывода извлекает ограниченный, учитывающий зависимости набор навыков с помощью гибридного семантико-лексического инициирования, обратно-взвешенного персонализированного PageRank и гидратации с учетом контекстного бюджета. На наборах данных SkillsBench и ALFWorld GoS улучшает среднее вознаграждение на 43.6% по сравнению с базовым подходом полной загрузки навыков, одновременно сокращая входные токены на 37.8%, и демонстрирует обобщаемость для трех семейств моделей: Claude Sonnet, GPT-5.2 Codex и MiniMax. Дополнительные абляционные исследования на библиотеках навыков объемом от 200 до 2000 навыков further показывают, что GoS стабильно превосходит как полную загрузку навыков, так и простой векторный поиск по балансу вознаграждения, токенной эффективности и времени выполнения.

English

Skill usage has become a core component of modern agent systems and can substantially improve agents' ability to complete complex tasks. In real-world settings, where agents must monitor and interact with numerous personal applications, web browsers, and other environment interfaces, skill libraries can scale to thousands of reusable skills. Scaling to larger skill sets introduces two key challenges. First, loading the full skill set saturates the context window, driving up token costs, hallucination, and latency. In this paper, we present Graph of Skills (GoS), an inference-time structural retrieval layer for large skill libraries. GoS constructs an executable skill graph offline from skill packages, then at inference time retrieves a bounded, dependency-aware skill bundle through hybrid semantic-lexical seeding, reverse-weighted Personalized PageRank, and context-budgeted hydration. On SkillsBench and ALFWorld, GoS improves average reward by 43.6% over the vanilla full skill-loading baseline while reducing input tokens by 37.8%, and generalizes across three model families: Claude Sonnet, GPT-5.2 Codex, and MiniMax. Additional ablation studies across skill libraries ranging from 200 to 2,000 skills further demonstrate that GoS consistently outperforms both vanilla skills loading and simple vector retrieval in balancing reward, token efficiency, and runtime.

Граф навыков: структурный поиск с учетом зависимостей для массивов агентных навыков

Graph of Skills: Dependency-Aware Structural Retrieval for Massive Agent Skills

Аннотация

Support