AgentSwing: 長期的Webエージェントのための適応的並列コンテキスト管理ルーティング
AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents
March 29, 2026
著者: Zhaopeng Feng, Liangcai Su, Zhen Zhang, Xinyu Wang, Xiaotian Zhang, Xiaobin Wang, Runnan Fang, Qi Zhang, Baixuan Li, Shihao Cai, Rui Ye, Hui Chen, Jiang Yong, Joey Tianyi Zhou, Chenxiong Qian, Pengjun Xie, Bryan Hooi, Zuozhu Liu, Jingren Zhou
cs.AI
要旨
大規模言語モデル(LLM)が長期的な情報探索を目的とした自律エージェントへと進化するにつれ、有限のコンテキスト容量の管理が重大なボトルネックとなっている。既存のコンテキスト管理手法は、通常、探索軌道全体を通じて単一の固定戦略に依存する。このような静的な設計は特定の状態では有効である場合もあるが、長期的な探索過程において蓄積されたコンテキストの有用性と信頼性が変化するにつれて適応できなくなる。この課題を定式化するため、我々は探索効率と終端精度という二つの相補的な次元を通じて長期的な成功を特徴づける確率的フレームワークを提案する。この視点に基づき、状態を認識し適応的に並列コンテキスト管理を行うルーティングフレームワーク「AgentSwing」を開発した。AgentSwingは各トリガーポイントで、複数のコンテキスト管理ブランチを並列に展開し、先読みルーティングを用いて最も有望な継続経路を選択する。多様なベンチマークとエージェント基盤モデルを用いた実験により、AgentSwingが強力な静的コンテキスト管理手法を一貫して上回り、多くの場合、相互作用ターン数を最大3分の1に削減しつつ同等以上の性能を達成するとともに、長期的なWebエージェントの最終的な性能限界も向上させることを実証した。経験的な性能向上に加え、提案する確率的フレームワークは、長期的エージェントのための将来のコンテキスト管理戦略を分析・設計するための原理的な視点を提供する。
English
As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.