SkVM: Kompilierung von Fähigkeiten für effiziente Ausführung überall

Zusammenfassung

LLM-Agenten verwenden zunehmend Skills als wiederverwendbare Kompositionseinheit. Obwohl Skills über verschiedene Agentenplattformen hinweg geteilt werden, behandeln aktuelle Systeme sie als Rohkontext, was dazu führt, dass derselbe Skill bei verschiedenen Agenten inkonsistent arbeitet. Diese Fragilität untergräbt die Portabilität und Ausführungseffizienz von Skills. Um diese Herausforderung zu bewältigen, analysieren wir 118.000 Skills und lassen uns vom traditionellen Compiler-Design inspirieren. Wir behandeln Skills als Code und LLMs als heterogene Prozessoren. Um Portabilität umsetzbar zu machen, zerlegen wir die Anforderungen eines Skills in einen Satz primitiver Fähigkeiten und messen, wie gut jedes Modell-Harness-Paar diese unterstützt. Basierend auf diesen Fähigkeitsprofilen schlagen wir SkVM vor, ein Compiler- und Laufzeitsystem, das für portable und effiziente Skill-Ausführung konzipiert ist. Zur Kompilierzeit führt SkVM fähigkeitsbasierte Kompilierung, Umgebungsbindung und Nebenläufigkeits-Extraktion durch. Zur Laufzeit wendet SkVM JIT-Code-Verfestigung und adaptive Neukompilierung zur Leistungsoptimierung an. Wir evaluieren SkVM mit acht LLMs unterschiedlicher Größe und drei Agenten-Harnesses, die SkillsBench und repräsentative Skill-Aufgaben abdecken. Die Ergebnisse zeigen, dass SkVM die Aufgabenabschlussrate über verschiedene Modelle und Umgebungen hinweg signifikant verbessert und gleichzeitig den Token-Verbrauch um bis zu 40% reduziert. Hinsichtlich der Leistung erzielt SkVM eine bis zu 3,2-fache Beschleunigung durch verbesserte Parallelität und eine 19- bis 50-fache Latenzreduzierung durch Code-Verfestigung.

English

LLM agents increasingly adopt skills as a reusable unit of composition. While skills are shared across diverse agent platforms, current systems treat them as raw context, causing the same skill to behave inconsistently for different agents. This fragility undermines skill portability and execution efficiency. To address this challenge, we analyze 118,000 skills and draw inspiration from traditional compiler design. We treat skills as code and LLMs as heterogeneous processors. To make portability actionable, we decompose a skill's requirements into a set of primitive capabilities, and measure how well each model-harness pair supports them. Based on these capability profiles, we propose SkVM, a compilation and runtime system designed for portable and efficient skill execution. At compile time, SkVM performs capability-based compilation, environment binding, and concurrency extraction. At runtime, SkVM applies JIT code solidification and adaptive recompilation for performance optimization. We evaluate SkVM across eight LLMs of varying scales and three agent harnesses, covering SkillsBench and representative skill tasks. Results demonstrate that SkVM significantly improves task completion rates across different models and environments while reducing token consumption by up to 40%. In terms of performance, SkVM achieves up to 3.2x speedup with enhanced parallelism, and 19-50x latency reduction through code solidification.

SkVM: Kompilierung von Fähigkeiten für effiziente Ausführung überall

SkVM: Compiling Skills for Efficient Execution Everywhere

Zusammenfassung

Support