ChatPaper.aiChatPaper

Масштабирование небольших агентов с помощью стратегических аукционов

Scaling Small Agents Through Strategy Auctions

February 2, 2026
Авторы: Lisa Alazraki, William F. Shen, Yoram Bachrach, Akhil Mathur
cs.AI

Аннотация

Малые языковые модели всё чаще рассматриваются как перспективный и экономически эффективный подход к созданию агентного ИИ, причём сторонники утверждают, что их возможностей достаточно для агентных рабочих процессов. Однако, хотя малые агенты могут почти не уступать крупным в простых задачах, остаётся неясным, как их производительность масштабируется со сложностью задачи, когда становятся необходимы большие модели и как лучше использовать малых агентов для долгосрочных рабочих нагрузок. В данной работе мы эмпирически показываем, что производительность малых агентов не масштабируется со сложностью задач в области глубокого поиска и программирования, и представляем Strategy Auctions for Workload Efficiency (SALE) — агентный фреймворк, вдохновлённый биржами фриланса. В SALE агенты делают ставки в виде кратких стратегических планов, которые оцениваются системным механизмом стоимости и ценности и улучшаются через общую память аукциона, что позволяет осуществлять маршрутизацию для каждой задачи и непрерывное самоулучшение без обучения отдельного маршрутизатора или полного выполнения всеми моделями. На задачах глубокого поиска и программирования разной сложности SALE снижает зависимость от самого крупного агента на 53%, сокращает общие затраты на 35% и стабильно превосходит показатель pass@1 крупнейшего агента при незначительных накладных расходах сверх выполнения финального трейса. В отличие от этого, существующие маршрутизаторы, основанные на описаниях задач, либо уступают крупнейшему агенту, либо не снижают затраты — часто и то, и другое — что подчёркивает их плохую пригодность для агентных рабочих процессов. Эти результаты свидетельствуют, что хотя малые агенты могут быть недостаточны для сложных нагрузок, их можно эффективно «масштабировать вверх» за счёт скоординированного распределения задач и самоулучшения во время тестирования. В более широком смысле они обосновывают системный взгляд на агентный ИИ, в котором прирост производительности достигается не столько за счёт всё более крупных индивидуальных моделей, сколько за счёт рыночно-вдохновлённых механизмов координации, организующих разнородных агентов в эффективные и адаптивные экосистемы.
English
Small language models are increasingly viewed as a promising, cost-effective approach to agentic AI, with proponents claiming they are sufficiently capable for agentic workflows. However, while smaller agents can closely match larger ones on simple tasks, it remains unclear how their performance scales with task complexity, when large models become necessary, and how to better leverage small agents for long-horizon workloads. In this work, we empirically show that small agents' performance fails to scale with task complexity on deep search and coding tasks, and we introduce Strategy Auctions for Workload Efficiency (SALE), an agent framework inspired by freelancer marketplaces. In SALE, agents bid with short strategic plans, which are scored by a systematic cost-value mechanism and refined via a shared auction memory, enabling per-task routing and continual self-improvement without training a separate router or running all models to completion. Across deep search and coding tasks of varying complexity, SALE reduces reliance on the largest agent by 53%, lowers overall cost by 35%, and consistently improves upon the largest agent's pass@1 with only a negligible overhead beyond executing the final trace. In contrast, established routers that rely on task descriptions either underperform the largest agent or fail to reduce cost -- often both -- underscoring their poor fit for agentic workflows. These results suggest that while small agents may be insufficient for complex workloads, they can be effectively "scaled up" through coordinated task allocation and test-time self-improvement. More broadly, they motivate a systems-level view of agentic AI in which performance gains come less from ever-larger individual models and more from market-inspired coordination mechanisms that organize heterogeneous agents into efficient, adaptive ecosystems.
PDF43February 8, 2026