SkVM: Компиляция навыков для эффективного выполнения повсюду

Аннотация

Агенты больших языковых моделей всё чаще используют навыки в качестве переиспользуемой единицы композиции. Хотя навыки распространяются на различных платформах для агентов, современные системы рассматривают их как необработанный контекст, что приводит к нестабильному поведению одного и того же навыка у разных агентов. Эта хрупкость подрывает переносимость навыков и эффективность их выполнения. Для решения этой проблемы мы проанализировали 118 000 навыков и почерпнули идеи из традиционного проектирования компиляторов. Мы рассматриваем навыки как код, а большие языковые модели — как гетерогенные процессоры. Чтобы сделать переносимость практичной, мы декомпозируем требования навыка в набор примитивных возможностей и оцениваем, насколько хорошо каждая пара «модель-обвязка» их поддерживает. На основе этих профилей возможностей мы предлагаем SkVM — систему компиляции и исполнения, разработанную для переносимого и эффективного выполнения навыков. На этапе компиляции SkVM выполняет компиляцию на основе возможностей, привязку к среде и извлечение параллелизма. Во время выполнения SkVM применяет JIT-твердение кода и адаптивную перекомпиляцию для оптимизации производительности. Мы оценили SkVM на восьми больших языковых моделях различного масштаба и трёх обвязках для агентов, охвативших SkillsBench и репрезентативные задачи на навыки. Результаты демонстрируют, что SkVM значительно повышает процент успешного выполнения задач в различных моделях и средах, одновременно сокращая потребление токенов до 40%. С точки зрения производительности SkVM достигает до 3,2-кратного ускорения за счёт улучшенного параллелизма и снижения задержек в 19–50 раз благодаря твердению кода.

English

LLM agents increasingly adopt skills as a reusable unit of composition. While skills are shared across diverse agent platforms, current systems treat them as raw context, causing the same skill to behave inconsistently for different agents. This fragility undermines skill portability and execution efficiency. To address this challenge, we analyze 118,000 skills and draw inspiration from traditional compiler design. We treat skills as code and LLMs as heterogeneous processors. To make portability actionable, we decompose a skill's requirements into a set of primitive capabilities, and measure how well each model-harness pair supports them. Based on these capability profiles, we propose SkVM, a compilation and runtime system designed for portable and efficient skill execution. At compile time, SkVM performs capability-based compilation, environment binding, and concurrency extraction. At runtime, SkVM applies JIT code solidification and adaptive recompilation for performance optimization. We evaluate SkVM across eight LLMs of varying scales and three agent harnesses, covering SkillsBench and representative skill tasks. Results demonstrate that SkVM significantly improves task completion rates across different models and environments while reducing token consumption by up to 40%. In terms of performance, SkVM achieves up to 3.2x speedup with enhanced parallelism, and 19-50x latency reduction through code solidification.

SkVM: Компиляция навыков для эффективного выполнения повсюду

SkVM: Compiling Skills for Efficient Execution Everywhere

Аннотация

Support