SkillOrchestra: Das Routing von Agenten durch Skill-Transfer erlernen

Zusammenfassung

Zusammengesetzte KI-Systeme versprechen Fähigkeiten, die über die einzelner Modelle hinausgehen, doch ihr Erfolg hängt entscheidend von einer effektiven Orchestrierung ab. Bestehende Routing-Ansätze weisen zwei Einschränkungen auf: (1) Eingabeebenen-Router treffen grobe, abfrageweite Entscheidungen, die sich ändernde Aufgabenanforderungen ignorieren; (2) RL-trainierte Orchestratoren sind teuer anzupassen und leiden oft unter Routing-Kollaps, indem sie in Mehrfachinteraktionen wiederholt eine starke, aber kostspielige Option aufrufen. Wir stellen SkillOrchestra vor, ein Framework für fähigkeitsbewusste Orchestrierung. Anstatt direkt eine Routing-Politik end-to-end zu lernen, erlernt SkillOrchestra feinkörnige Fähigkeiten aus Ausführungserfahrungen und modelliert agentspezifische Kompetenz und Kosten unter diesen Fähigkeiten. Bei der Bereitstellung leitet der Orchestrator die Fähigkeitsanforderungen der aktuellen Interaktion ab und wählt Agenten aus, die diese unter einem expliziten Leistungs-Kosten-Kompromiss optimal erfüllen. Umfangreiche Experimente über zehn Benchmarks zeigen, dass SkillOrchestra state-of-the-art RL-basierte Orchestratoren um bis zu 22,5% übertrifft, bei gleichzeitiger Reduzierung der Lernkosten um das 700-fache bzw. 300-fache im Vergleich zu Router-R1 und ToolOrchestra. Diese Ergebnisse zeigen, dass explizite Fähigkeitsmodellierung skalierbare, interpretierbare und sample-effiziente Orchestrierung ermöglicht und eine prinzipielle Alternative zu datenintensiven RL-basierten Ansätzen bietet. Der Code ist verfügbar unter: https://github.com/jiayuww/SkillOrchestra.

English

Compound AI systems promise capabilities beyond those of individual models, yet their success depends critically on effective orchestration. Existing routing approaches face two limitations: (1) input-level routers make coarse query-level decisions that ignore evolving task requirements; (2) RL-trained orchestrators are expensive to adapt and often suffer from routing collapse, repeatedly invoking one strong but costly option in multi-turn scenarios. We introduce SkillOrchestra, a framework for skill-aware orchestration. Instead of directly learning a routing policy end-to-end, SkillOrchestra learns fine-grained skills from execution experience and models agent-specific competence and cost under those skills. At deployment, the orchestrator infers the skill demands of the current interaction and selects agents that best satisfy them under an explicit performance-cost trade-off. Extensive experiments across ten benchmarks demonstrate that SkillOrchestra outperforms SoTA RL-based orchestrators by up to 22.5% with 700x and 300x learning cost reduction compared to Router-R1 and ToolOrchestra, respectively. These results show that explicit skill modeling enables scalable, interpretable, and sample-efficient orchestration, offering a principled alternative to data-intensive RL-based approaches. The code is available at: https://github.com/jiayuww/SkillOrchestra.

SkillOrchestra: Das Routing von Agenten durch Skill-Transfer erlernen

SkillOrchestra: Learning to Route Agents via Skill Transfer

Zusammenfassung

Support