SkillOrchestra: Apprendimento del Routing degli Agenti tramite Trasferimento di Abilità

Abstract

I sistemi di IA composti promettono capacità superiori a quelle dei singoli modelli, ma il loro successo dipende criticamente da un'orchestrazione efficace. Gli approcci di routing esistenti presentano due limitazioni: (1) i router a livello di input prendono decisioni grossolane a livello di query che ignorano i requisiti evolutivi del compito; (2) gli orchestratori addestrati con RL sono costosi da adattare e spesso soffrono di collasso del routing, invocando ripetutamente un'opzione potente ma costosa in scenari multi-turn. Introduciamo SkillOrchestra, un framework per l'orchestrazione consapevole delle abilità. Invece di apprendere direttamente una politica di routing end-to-end, SkillOrchestra apprende abilità granulari dall'esperienza di esecuzione e modella la competenza e il costo specifici degli agenti in relazione a tali abilità. In fase di deployment, l'orchestratore inferisce le richieste di abilità dell'interazione corrente e seleziona gli agenti che le soddisfano al meglio sotto un esplicito compromesso prestazioni-costo. Esperimenti estesi su dieci benchmark dimostrano che SkillOrchestra supera gli orchestratori basati su RL allo stato dell'arte fino al 22,5%, con una riduzione del costo di apprendimento di 700x e 300x rispetto a Router-R1 e ToolOrchestra, rispettivamente. Questi risultati mostrano che la modellazione esplicita delle abilità abilita un'orchestrazione scalabile, interpretabile ed efficiente nel campionamento, offrendo un'alternativa principiata agli approcci basati su RL ad alta intensità di dati. Il codice è disponibile all'indirizzo: https://github.com/jiayuww/SkillOrchestra.

English

Compound AI systems promise capabilities beyond those of individual models, yet their success depends critically on effective orchestration. Existing routing approaches face two limitations: (1) input-level routers make coarse query-level decisions that ignore evolving task requirements; (2) RL-trained orchestrators are expensive to adapt and often suffer from routing collapse, repeatedly invoking one strong but costly option in multi-turn scenarios. We introduce SkillOrchestra, a framework for skill-aware orchestration. Instead of directly learning a routing policy end-to-end, SkillOrchestra learns fine-grained skills from execution experience and models agent-specific competence and cost under those skills. At deployment, the orchestrator infers the skill demands of the current interaction and selects agents that best satisfy them under an explicit performance-cost trade-off. Extensive experiments across ten benchmarks demonstrate that SkillOrchestra outperforms SoTA RL-based orchestrators by up to 22.5% with 700x and 300x learning cost reduction compared to Router-R1 and ToolOrchestra, respectively. These results show that explicit skill modeling enables scalable, interpretable, and sample-efficient orchestration, offering a principled alternative to data-intensive RL-based approaches. The code is available at: https://github.com/jiayuww/SkillOrchestra.

SkillOrchestra: Apprendimento del Routing degli Agenti tramite Trasferimento di Abilità

SkillOrchestra: Learning to Route Agents via Skill Transfer

Abstract

Support