Van vaardigheidstekst naar vaardigheidsstructuur: de plannings-structureel-logische representatie voor agentvaardigheden
From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills
April 27, 2026
Auteurs: Qiliang Liang, Hansi Wang, Zhong Liang, Yang Liu
cs.AI
Samenvatting
LLM-agenten maken in toenemende mate gebruik van herbruikbare vaardigheden: capaciteitspakketten die instructies, controleflow, beperkingen en tool-aanroepen combineren. In de meeste huidige agentsystemen worden vaardigheden echter nog steeds vertegenwoordigd door tekstrijke artefacten, waaronder SKILL.md-stijl documenten en gestructureerde records waarvan de machinebruikbare evidentie grotendeels verborgen blijft in natuurlijke-taalbeschrijvingen. Dit vormt een uitdaging voor vaardigheidsgerichte agentsystemen: zowel het beheren van vaardigheidsverzamelingen als het gebruik van vaardigheden om agenten te ondersteunen vereisen redenering over aanroepinterfaces, uitvoeringsstructuur en concrete neveneffecten die vaak verweven zijn in een enkel tekstueel oppervlak. Een expliciete representatie van vaardigheidskennis kan daarom helpen om deze artefacten gemakkelijker voor machines te verwerven en te benutten.
Voortbouwend op Memory Organization Packets, Script Theory en Conceptual Dependency uit het klassieke werk van Schank en Abelson over linguïstische kennisfrepresentatie, introduceren wij naar ons weten de eerste gestructureerde representatie voor agent-vaardigheidsartefacten die vaardigheidsniveau-planningssignalen, scèneniveau-uitvoeringsstructuur en logicaniveau-actie- en resourcegebruiksevidentie ontwart: de Scheduling-Structural-Logical (SSL)-representatie. Wij concretiseren SSL met een op LLM gebaseerde normalisator en evalueren het op een corpus van vaardigheden in twee taken, Vaardigheidsontdekking en Risicobeoordeling, en overtreffen de uitsluitend tekstuele basislijnen aanzienlijk: bij Vaardigheidsontdekking verbetert SSL de MRR van 0.573 naar 0.707; bij Risicobeoordeling verbetert het de macro F1-score van 0.744 naar 0.787.
Deze bevindingen tonen aan dat expliciete, op de bron gegronde structuur agent-vaardigheden gemakkelijker doorzoekbaar en beoordeelbaar maakt. Zij suggereren ook dat SSL het best kan worden begrepen als een praktische stap naar meer inspecteerbare, herbruikbare en operationeel bruikbare vaardigheidsrepresentaties voor agentsystemen, in plaats van als een voltooide standaard of een end-to-end mechanisme voor het beheren en gebruiken van vaardigheden.
English
LLM agents increasingly rely on reusable skills, capability packages that combine instructions, control flow, constraints, and tool calls. In most current agent systems, however, skills are still represented by text-heavy artifacts, including SKILL.md-style documents and structured records whose machine-usable evidence remains embedded largely in natural-language descriptions. This poses a challenge for skill-centered agent systems: managing skill collections and using skills to support agent both require reasoning over invocation interfaces, execution structure, and concrete side effects that are often entangled in a single textual surface. An explicit representation of skill knowledge may therefore help make these artifacts easier for machines to acquire and leverage. Drawing on Memory Organization Packets, Script Theory, and Conceptual Dependency from Schank and Abelson's classical work on linguistic knowledge representation, we introduce what is, to our knowledge, the first structured representation for agent skill artifacts that disentangles skill-level scheduling signals, scene-level execution structure, and logic-level action and resource-use evidence: the Scheduling-Structural-Logical (SSL) representation. We instantiate SSL with an LLM-based normalizer and evaluate it on a corpus of skills in two tasks, Skill Discovery and Risk Assessment, and superiorly outperform the text-only baselines: in Skill Discovery, SSL improves MRR from 0.573 to 0.707; in Risk Assessment, it improves macro F1 from 0.744 to 0.787. These findings reveal that explicit, source-grounded structure makes agent skills easier to search and review. They also suggest that SSL is best understood as a practical step toward more inspectable, reusable, and operationally actionable skill representations for agent systems, rather than as a finished standard or an end-to-end mechanism for managing and using skills.