От текста навыка к структуре навыка: планировочно-структурно-логическое представление агентных навыков

Аннотация

Агенты на основе больших языковых моделей всё чаще опираются на переиспользуемые навыки — пакеты возможностей, объединяющие инструкции, поток управления, ограничения и вызовы инструментов. Однако в большинстве современных агентных систем навыки по-прежнему представлены текстоёмкими артефактами, включая документы в стиле SKILL.md и структурированные записи, чьи машинно-пригодные доказательства остаются в значительной степени встроенными в естественно-языковые описания. Это создаёт проблему для систем, ориентированных на навыки: как управление коллекциями навыков, так и их использование для поддержки агента требуют рассуждений над интерфейсами вызова, структурой выполнения и конкретными побочными эффектами, которые часто переплетены в единой текстовой поверхности. Явное представление знаний о навыках может поэтому помочь сделать эти артефакты более удобными для приобретения и использования машинами. Опираясь на пакеты организации памяти, теорию скриптов и концептуальные зависимости из классической работы Шэнка и Абельсона о лингвистическом представлении знаний, мы представляем, насколько нам известно, первую структурированную репрезентацию для артефактов навыков агентов, которая разделяет сигналы планирования на уровне навыков, структуру выполнения на уровне сцены и доказательства действий и использования ресурсов на логическом уровне: представление «Планирование-Структура-Логика» (ПСЛ). Мы реализуем ПСЛ с помощью нормализатора на основе LLM и оцениваем его на корпусе навыков в двух задачах — обнаружении навыков и оценке рисков, — значительно превосходя текстовые базовые линии: в задаче обнаружения навыков ПСЛ улучшает MRR с 0,573 до 0,707; в оценке рисков он повышает макро-F1 с 0,744 до 0,787. Эти результаты показывают, что явная, обоснованная источниками структура облегчает поиск и анализ навыков агентов. Они также позволяют предположить, что ПСЛ лучше понимать как практический шаг к более проверяемым, переиспользуемым и операционно-действенным представлениям навыков для агентных систем, а не как готовый стандарт или сквозной механизм для управления и использования навыков.

English

LLM agents increasingly rely on reusable skills, capability packages that combine instructions, control flow, constraints, and tool calls. In most current agent systems, however, skills are still represented by text-heavy artifacts, including SKILL.md-style documents and structured records whose machine-usable evidence remains embedded largely in natural-language descriptions. This poses a challenge for skill-centered agent systems: managing skill collections and using skills to support agent both require reasoning over invocation interfaces, execution structure, and concrete side effects that are often entangled in a single textual surface. An explicit representation of skill knowledge may therefore help make these artifacts easier for machines to acquire and leverage. Drawing on Memory Organization Packets, Script Theory, and Conceptual Dependency from Schank and Abelson's classical work on linguistic knowledge representation, we introduce what is, to our knowledge, the first structured representation for agent skill artifacts that disentangles skill-level scheduling signals, scene-level execution structure, and logic-level action and resource-use evidence: the Scheduling-Structural-Logical (SSL) representation. We instantiate SSL with an LLM-based normalizer and evaluate it on a corpus of skills in two tasks, Skill Discovery and Risk Assessment, and superiorly outperform the text-only baselines: in Skill Discovery, SSL improves MRR from 0.573 to 0.707; in Risk Assessment, it improves macro F1 from 0.744 to 0.787. These findings reveal that explicit, source-grounded structure makes agent skills easier to search and review. They also suggest that SSL is best understood as a practical step toward more inspectable, reusable, and operationally actionable skill representations for agent systems, rather than as a finished standard or an end-to-end mechanism for managing and using skills.

От текста навыка к структуре навыка: планировочно-структурно-логическое представление агентных навыков

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills

Аннотация

Support