AgentSwing: Адаптивная маршрутизация управления параллельным контекстом для веб-агентов с длинным горизонтом планирования

Аннотация

По мере того как большие языковые модели (LLM) превращаются в автономных агентов для решения долгосрочных информационных задач, управление ограниченной емкостью контекста стало критическим узким местом. Существующие методы управления контекстом обычно придерживаются единой фиксированной стратегии на протяжении всей траектории работы. Такие статические подходы могут хорошо работать в некоторых состояниях, но они не способны адаптироваться по мере того, как полезность и надежность накопленного контекста изменяются в процессе долгосрочного поиска. Для формализации этой проблемы мы представляем вероятностную модель, которая характеризует успех в долгосрочной перспективе через два взаимодополняющих аспекта: эффективность поиска и конечную точность. Основываясь на этом подходе, мы предлагаем AgentSwing — адаптивную систему параллельного маршрутизированного управления контекстом с учетом состояния. В каждой точке принятия решения AgentSwing параллельно развертывает несколько ветвей с разным управлением контекстом и использует опережающую маршрутизацию для выбора наиболее перспективного продолжения. Эксперименты на различных тестовых наборах и с разными архитектурами агентов показывают, что AgentSwing стабильно превосходит мощные статические методы управления контекстом, часто достигая или превышая их производительность при сокращении количества шагов взаимодействия до 3 раз, одновременно повышая предельный уровень эффективности веб-агентов в долгосрочных задачах. Помимо эмпирических преимуществ, предложенная вероятностная модель предоставляет принципиальную основу для анализа и проектирования будущих стратегий управления контекстом для агентов с долгосрочными горизонтами планирования.

English

As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.

AgentSwing: Адаптивная маршрутизация управления параллельным контекстом для веб-агентов с длинным горизонтом планирования

AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents

Аннотация

Support