Du Texte de Compétence à la Structure de Compétence : La Représentation Planification-Structure-Logique pour les Compétences des Agents

Résumé

Les agents LLM reposent de plus en plus sur des compétences réutilisables, des ensembles de capacités combinant instructions, flux de contrôle, contraintes et appels d'outils. Cependant, dans la plupart des systèmes d'agents actuels, les compétences sont encore représentées par des artefacts textuels lourds, incluant des documents de type SKILL.md et des enregistrements structurés dont les preuves exploitables par la machine restent largement enfouies dans des descriptions en langage naturel. Ceci pose un défi aux systèmes d'agents centrés sur les compétences : la gestion des collections de compétences et leur utilisation pour soutenir l'agent nécessitent toutes deux un raisonnement sur les interfaces d'invocation, la structure d'exécution et les effets secondaires concrets, souvent entremêlés dans une unique surface textuelle. Une représentation explicite des connaissances des compétences pourrait donc aider à rendre ces artefacts plus faciles à acquérir et à exploiter par les machines. En nous inspirant des Memory Organization Packets, de la Script Theory et de la Conceptual Dependency tirés des travaux classiques de Schank et Abelson sur la représentation des connaissances linguistiques, nous présentons ce qui est, à notre connaissance, la première représentation structurée pour les artefacts de compétences d'agents qui démêle les signaux d'ordonnancement au niveau de la compétence, la structure d'exécution au niveau de la scène, et les preuves d'action et d'utilisation des ressources au niveau logique : la représentation Scheduling-Structural-Logical (SSL). Nous instancions SSL avec un normalisateur basé sur un LLM et l'évaluons sur un corpus de compétences dans deux tâches, la Découverte de Compétences et l'Évaluation des Risques, surpassant nettement les lignes de base uniquement textuelles : dans la Découverte de Compétences, SSL améliore le MRR de 0,573 à 0,707 ; dans l'Évaluation des Risques, il améliore le F1 macro de 0,744 à 0,787. Ces résultats révèlent qu'une structure explicite et ancrée dans la source rend les compétences des agents plus faciles à rechercher et à examiner. Ils suggèrent également que SSL est mieux compris comme une étape pratique vers des représentations de compétences plus inspectables, réutilisables et actionnables opérationnellement pour les systèmes d'agents, plutôt que comme un standard achevé ou un mécanisme de bout en bout pour gérer et utiliser les compétences.

English

LLM agents increasingly rely on reusable skills, capability packages that combine instructions, control flow, constraints, and tool calls. In most current agent systems, however, skills are still represented by text-heavy artifacts, including SKILL.md-style documents and structured records whose machine-usable evidence remains embedded largely in natural-language descriptions. This poses a challenge for skill-centered agent systems: managing skill collections and using skills to support agent both require reasoning over invocation interfaces, execution structure, and concrete side effects that are often entangled in a single textual surface. An explicit representation of skill knowledge may therefore help make these artifacts easier for machines to acquire and leverage. Drawing on Memory Organization Packets, Script Theory, and Conceptual Dependency from Schank and Abelson's classical work on linguistic knowledge representation, we introduce what is, to our knowledge, the first structured representation for agent skill artifacts that disentangles skill-level scheduling signals, scene-level execution structure, and logic-level action and resource-use evidence: the Scheduling-Structural-Logical (SSL) representation. We instantiate SSL with an LLM-based normalizer and evaluate it on a corpus of skills in two tasks, Skill Discovery and Risk Assessment, and superiorly outperform the text-only baselines: in Skill Discovery, SSL improves MRR from 0.573 to 0.707; in Risk Assessment, it improves macro F1 from 0.744 to 0.787. These findings reveal that explicit, source-grounded structure makes agent skills easier to search and review. They also suggest that SSL is best understood as a practical step toward more inspectable, reusable, and operationally actionable skill representations for agent systems, rather than as a finished standard or an end-to-end mechanism for managing and using skills.

Du Texte de Compétence à la Structure de Compétence : La Représentation Planification-Structure-Logique pour les Compétences des Agents

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills

Résumé

Support