Skalierung kleiner Agenten durch Strategieauktionen
Scaling Small Agents Through Strategy Auctions
February 2, 2026
papers.authors: Lisa Alazraki, William F. Shen, Yoram Bachrach, Akhil Mathur
cs.AI
papers.abstract
Kleine Sprachmodelle werden zunehmend als vielversprechender, kostengünstiger Ansatz für agentenbasierte KI angesehen, wobei Befürworter behaupten, dass sie für agentenbasierte Workflows ausreichend leistungsfähig sind. Allerdings bleibt unklar, wie gut kleine Agenten bei komplexeren Aufgaben skalieren, wann große Modelle notwendig werden und wie kleine Agenten besser für langfristige Workloads genutzt werden können. In dieser Arbeit zeigen wir empirisch, dass die Leistung kleiner Agenten bei tiefgreifenden Such- und Coding-Aufgaben mit der Komplexität nicht mithält, und wir stellen Strategy Auctions for Workload Efficiency (SALE) vor – einen Agentenrahmen, der von Freelancer-Märkten inspiriert ist. In SALE bieten Agenten mit kurzen strategischen Plänen, die durch einen systematischen Kosten-Nutzen-Mechanismus bewertet und über einen gemeinsamen Auktionsspeicher verfeinert werden. Dies ermöglicht eine aufgabenspezifische Routing-Entscheidung und kontinuierliche Selbstverbesserung, ohne einen separaten Router trainieren oder alle Modelle bis zum Abschluss laufen lassen zu müssen. Bei tiefgreifenden Such- und Coding-Aufgaben unterschiedlicher Komplexität reduziert SALE die Abhängigkeit vom größten Agenten um 53 %, senkt die Gesamtkosten um 35 % und übertrifft konsistent die Pass@1-Leistung des größten Agenten – bei nur minimalem Overhead über die Ausführung der finalen Ablaufverfolgung hinaus. Etablierte Router, die auf Aufgabenbeschreibungen basieren, liegen dagegen entweder unter der Leistung des größten Agenten oder senken die Kosten nicht – oft beides – was ihre mangelnde Eignung für agentenbasierte Workflows unterstreicht. Diese Ergebnisse deuten darauf hin, dass kleine Agenten für komplexe Workloads zwar unzureichend sein mögen, aber durch koordinierte Aufgabenverteilung und Selbstverbesserung zur Laufzeit effektiv „hochskaliert“ werden können. Im weiteren Sinne plädieren sie für eine systemische Betrachtung agentenbasierter KI, bei der Leistungssteigerungen weniger von immer größeren Einzelmodellen, sondern mehr von marktinspirierten Koordinationsmechanismen kommen, die heterogene Agenten zu effizienten, adaptiven Ökosystemen organisieren.
English
Small language models are increasingly viewed as a promising, cost-effective approach to agentic AI, with proponents claiming they are sufficiently capable for agentic workflows. However, while smaller agents can closely match larger ones on simple tasks, it remains unclear how their performance scales with task complexity, when large models become necessary, and how to better leverage small agents for long-horizon workloads. In this work, we empirically show that small agents' performance fails to scale with task complexity on deep search and coding tasks, and we introduce Strategy Auctions for Workload Efficiency (SALE), an agent framework inspired by freelancer marketplaces. In SALE, agents bid with short strategic plans, which are scored by a systematic cost-value mechanism and refined via a shared auction memory, enabling per-task routing and continual self-improvement without training a separate router or running all models to completion. Across deep search and coding tasks of varying complexity, SALE reduces reliance on the largest agent by 53%, lowers overall cost by 35%, and consistently improves upon the largest agent's pass@1 with only a negligible overhead beyond executing the final trace. In contrast, established routers that rely on task descriptions either underperform the largest agent or fail to reduce cost -- often both -- underscoring their poor fit for agentic workflows. These results suggest that while small agents may be insufficient for complex workloads, they can be effectively "scaled up" through coordinated task allocation and test-time self-improvement. More broadly, they motivate a systems-level view of agentic AI in which performance gains come less from ever-larger individual models and more from market-inspired coordination mechanisms that organize heterogeneous agents into efficient, adaptive ecosystems.