Escalonamento de Pequenos Agentes por Meio de Leilões de Estratégia

Resumo

Os pequenos modelos de linguagem são cada vez mais vistos como uma abordagem promissora e económica para IA agentiva, com proponentes a afirmar que são suficientemente capazes para fluxos de trabalho agentivos. No entanto, embora agentes menores possam equiparar-se de perto a agentes maiores em tarefas simples, permanece incerto como o seu desempenho escala com a complexidade da tarefa, quando é que modelos grandes se tornam necessários e como melhor aproveitar agentes pequenos para cargas de trabalho de longo horizonte. Neste trabalho, mostramos empiricamente que o desempenho de agentes pequenos não escala com a complexidade da tarefa em tarefas de pesquisa profunda e codificação, e introduzimos Strategy Auctions for Workload Efficiency (SALE), um framework de agentes inspirado em mercados de freelancers. No SALE, os agentes licitam com planos estratégicos curtos, que são pontuados por um mecanismo sistemático de custo-valor e refinados através de uma memória de leilão partilhada, permitindo o encaminhamento por tarefa e a autoaprimoração contínua sem treinar um router separado ou executar todos os modelos até à conclusão. Em tarefas de pesquisa profunda e codificação de complexidade variada, o SALE reduz a dependência do maior agente em 53%, diminui o custo total em 35% e melhora consistentemente o pass@1 do maior agente com apenas uma sobrecarga insignificante além da execução do traço final. Em contraste, routers estabelecidos que dependem de descrições de tarefas têm desempenho inferior ao do maior agente ou não conseguem reduzir custos — frequentemente ambos — salientando a sua má adequação para fluxos de trabalho agentivos. Estes resultados sugerem que, embora agentes pequenos possam ser insuficientes para cargas de trabalho complexas, podem ser efetivamente "dimensionados" através da alocação coordenada de tarefas e da autoaprimoração em tempo de teste. Mais amplamente, motivam uma visão sistémica da IA agentiva na qual os ganhos de desempenho provêm menos de modelos individuais cada vez maiores e mais de mecanismos de coordenação inspirados no mercado que organizam agentes heterogéneos em ecossistemas eficientes e adaptativos.

English

Small language models are increasingly viewed as a promising, cost-effective approach to agentic AI, with proponents claiming they are sufficiently capable for agentic workflows. However, while smaller agents can closely match larger ones on simple tasks, it remains unclear how their performance scales with task complexity, when large models become necessary, and how to better leverage small agents for long-horizon workloads. In this work, we empirically show that small agents' performance fails to scale with task complexity on deep search and coding tasks, and we introduce Strategy Auctions for Workload Efficiency (SALE), an agent framework inspired by freelancer marketplaces. In SALE, agents bid with short strategic plans, which are scored by a systematic cost-value mechanism and refined via a shared auction memory, enabling per-task routing and continual self-improvement without training a separate router or running all models to completion. Across deep search and coding tasks of varying complexity, SALE reduces reliance on the largest agent by 53%, lowers overall cost by 35%, and consistently improves upon the largest agent's pass@1 with only a negligible overhead beyond executing the final trace. In contrast, established routers that rely on task descriptions either underperform the largest agent or fail to reduce cost -- often both -- underscoring their poor fit for agentic workflows. These results suggest that while small agents may be insufficient for complex workloads, they can be effectively "scaled up" through coordinated task allocation and test-time self-improvement. More broadly, they motivate a systems-level view of agentic AI in which performance gains come less from ever-larger individual models and more from market-inspired coordination mechanisms that organize heterogeneous agents into efficient, adaptive ecosystems.

Escalonamento de Pequenos Agentes por Meio de Leilões de Estratégia

Scaling Small Agents Through Strategy Auctions

Resumo

Support