AgentSwing: Adaptief Parallel Contextbeheer Routeren voor Webagenten met Lange Horizons

Samenvatting

Naarmate grote taalmodellen (LLM's) evolueren naar autonome agents voor langetermijn-informatiezoekopdrachten, is het beheren van beperkte contextcapaciteit een kritieke bottleneck geworden. Bestaande contextbeheermethoden hanteren doorgaans een enkele vaste strategie gedurende het gehele traject. Dergelijke statische ontwerpen kunnen in sommige toestanden goed werken, maar ze kunnen zich niet aanpassen naarmate de bruikbaarheid en betrouwbaarheid van de opgebouwde context evolueren tijdens een langdurige zoektocht. Om deze uitdaging te formaliseren, introduceren we een probabilistisch kader dat langetermijnsucces karakteriseert via twee complementaire dimensies: zoekefficiëntie en terminale precisie. Voortbouwend op dit perspectief presenteren we AgentSwing, een toestandsbewust adaptief parallel kader voor contextbeheerroutering. Op elk triggerpunt expandeert AgentSwing parallel meerdere context-gemanagede vertakkingen en gebruikt lookahead-routering om de meest veelbelovende voortzetting te selecteren. Experimenten met diverse benchmarks en agent-backbones tonen aan dat AgentSwing consequent sterke statische contextbeheermethoden overtreft, vaak hun prestaties evenaart of overstijgt met tot 3 keer minder interactiestappen, terwijl ook de uiteindelijke prestatiegrens van langetermijn-webagentschappen wordt verbeterd. Naast de empirische winst biedt het voorgestelde probabilistische kader een principieel perspectief voor het analyseren en ontwerpen van toekomstige contextbeheerstrategieën voor langetermijn-agentschappen.

English

As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.

AgentSwing: Adaptief Parallel Contextbeheer Routeren voor Webagenten met Lange Horizons

AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents

Samenvatting

Support