ChatPaper.aiChatPaper

Het schalen van kleine agentschappen via strategieveilingen

Scaling Small Agents Through Strategy Auctions

February 2, 2026
Auteurs: Lisa Alazraki, William F. Shen, Yoram Bachrach, Akhil Mathur
cs.AI

Samenvatting

Kleinere taalmodellen worden steeds meer gezien als een veelbelovende, kosteneffectieve benadering voor agent-gebaseerde AI, waarbij voorstanders beweren dat ze voldoende capaciteit hebben voor agent-workflows. Echter, hoewel kleinere agents de prestaties van grotere kunnen evenaren bij eenvoudige taken, is het onduidelijk hoe hun prestaties zich verhouden tot de taakcomplexiteit, wanneer grote modellen noodzakelijk worden, en hoe kleine agents beter kunnen worden ingezet voor langetermijnworkloads. In dit werk tonen we empirisch aan dat de prestaties van kleine agents niet meeschalen met de complexiteit van diepe zoek- en codeertaken, en introduceren we Strategy Auctions for Workload Efficiency (SALE), een agent-framework geïnspireerd op freelancersmarkten. In SALE bieden agents met korte strategische plannen, die worden beoordeeld door een systematisch kosten-waardemechanisme en verfijnd via een gedeeld auction-geheugen. Dit maakt taakspecifieke routering en continue zelfverbetering mogelijk zonder een aparte router te trainen of alle modellen volledig te laten draaien. Over diepe zoek- en codeertaken van uiteenlopende complexiteit reduceert SALE de afhankelijkheid van de grootste agent met 53%, verlaagt het de totale kosten met 35% en verbetert het consistent de pass@1-score van de grootste agent, met slechts een verwaarloosbare overhead buiten het uitvoeren van de uiteindelijke trace. Gevestigde routers die op taakbeschrijvingen vertrouwen, presteren daarentegen slechter dan de grootste agent of slagen er niet in de kosten te verlagen – vaak beide – wat hun slechte geschiktheid voor agent-workflows onderstreept. Deze resultaten suggereren dat hoewel kleine agents onvoldoende kunnen zijn voor complexe workloads, ze effectief kunnen worden "opgeschaald" door gecoördineerde taaktoewijzing en zelfverbetering tijdens het testen. In bredere zin pleiten ze voor een systeemniveau-benadering van agent-gebaseerde AI, waarbij prestatieverbeteringen minder komen van steeds grotere individuele modellen en meer van marktgeïnspireerde coördinatiemechanismen die heterogene agents organiseren tot efficiënte, adaptieve ecosystemen.
English
Small language models are increasingly viewed as a promising, cost-effective approach to agentic AI, with proponents claiming they are sufficiently capable for agentic workflows. However, while smaller agents can closely match larger ones on simple tasks, it remains unclear how their performance scales with task complexity, when large models become necessary, and how to better leverage small agents for long-horizon workloads. In this work, we empirically show that small agents' performance fails to scale with task complexity on deep search and coding tasks, and we introduce Strategy Auctions for Workload Efficiency (SALE), an agent framework inspired by freelancer marketplaces. In SALE, agents bid with short strategic plans, which are scored by a systematic cost-value mechanism and refined via a shared auction memory, enabling per-task routing and continual self-improvement without training a separate router or running all models to completion. Across deep search and coding tasks of varying complexity, SALE reduces reliance on the largest agent by 53%, lowers overall cost by 35%, and consistently improves upon the largest agent's pass@1 with only a negligible overhead beyond executing the final trace. In contrast, established routers that rely on task descriptions either underperform the largest agent or fail to reduce cost -- often both -- underscoring their poor fit for agentic workflows. These results suggest that while small agents may be insufficient for complex workloads, they can be effectively "scaled up" through coordinated task allocation and test-time self-improvement. More broadly, they motivate a systems-level view of agentic AI in which performance gains come less from ever-larger individual models and more from market-inspired coordination mechanisms that organize heterogeneous agents into efficient, adaptive ecosystems.
PDF43February 8, 2026