SkVM: Compilação de Habilidades para Execução Eficiente em Qualquer Lugar

Resumo

Os agentes de LLM estão a adotar cada vez mais as competências (skills) como uma unidade reutilizável de composição. Embora as competências sejam partilhadas em diversas plataformas de agentes, os sistemas atuais tratam-nas como contexto bruto, fazendo com que a mesma competência se comporte de forma inconsistente em diferentes agentes. Esta fragilidade compromete a portabilidade e a eficiência de execução das competências. Para enfrentar este desafio, analisámos 118.000 competências e inspirámo-nos no design tradicional de compiladores. Tratamos as competências como código e os LLMs como processadores heterogéneos. Para tornar a portabilidade acionável, decompomos os requisitos de uma competência num conjunto de capacidades primitivas e medimos o quão bem cada par modelo-harness as suporta. Com base nestes perfis de capacidade, propomos o SkVM, um sistema de compilação e runtime concebido para uma execução de competências portátil e eficiente. Em tempo de compilação, o SkVM realiza compilação baseada em capacidades, vinculação de ambiente e extração de concorrência. Em tempo de execução, o SkVM aplica solidificação de código JIT e recompilação adaptativa para otimização de desempenho. Avaliámos o SkVM em oito LLMs de várias escalas e três harnesses de agentes, abrangendo o SkillsBench e tarefas de competências representativas. Os resultados demonstram que o SkVM melhora significativamente as taxas de conclusão de tarefas em diferentes modelos e ambientes, ao mesmo tempo que reduz o consumo de tokens em até 40%. Em termos de desempenho, o SkVM alcança uma aceleração de até 3,2x com paralelismo aprimorado e uma redução de latência de 19-50x através da solidificação de código.

English

LLM agents increasingly adopt skills as a reusable unit of composition. While skills are shared across diverse agent platforms, current systems treat them as raw context, causing the same skill to behave inconsistently for different agents. This fragility undermines skill portability and execution efficiency. To address this challenge, we analyze 118,000 skills and draw inspiration from traditional compiler design. We treat skills as code and LLMs as heterogeneous processors. To make portability actionable, we decompose a skill's requirements into a set of primitive capabilities, and measure how well each model-harness pair supports them. Based on these capability profiles, we propose SkVM, a compilation and runtime system designed for portable and efficient skill execution. At compile time, SkVM performs capability-based compilation, environment binding, and concurrency extraction. At runtime, SkVM applies JIT code solidification and adaptive recompilation for performance optimization. We evaluate SkVM across eight LLMs of varying scales and three agent harnesses, covering SkillsBench and representative skill tasks. Results demonstrate that SkVM significantly improves task completion rates across different models and environments while reducing token consumption by up to 40%. In terms of performance, SkVM achieves up to 3.2x speedup with enhanced parallelism, and 19-50x latency reduction through code solidification.

SkVM: Compilação de Habilidades para Execução Eficiente em Qualquer Lugar

SkVM: Compiling Skills for Efficient Execution Everywhere

Resumo

Support