AgentSwing: Adaptive parallele Kontextmanagement-Routing für Web-Agenten mit langem Planungshorizont

Zusammenfassung

Da sich große Sprachmodelle (LLMs) zu autonomen Agenten für langfristige Informationssuche entwickeln, ist die Bewältigung begrenzter Kontextkapazitäten zu einem kritischen Engpass geworden. Bestehende Kontextverwaltungsmethoden verfolgen typischerweise während des gesamten Trajektorieverlaufs eine einzige feste Strategie. Solche statischen Ansätze mögen in manchen Zuständen gut funktionieren, können sich jedoch nicht anpassen, wenn sich die Nützlichkeit und Zuverlässigkeit des gesammelten Kontexts während der langfristigen Suche verändern. Um diese Herausforderung zu formalisieren, führen wir einen probabilistischen Rahmen ein, der langfristigen Erfolg durch zwei komplementäre Dimensionen charakterisiert: Such effizienz und terminale Präzision. Aufbauend auf dieser Perspektive schlagen wir AgentSwing vor, einen zustandsbewussten, adaptiven Framework für paralleles Kontextmanagement-Routing. An jedem Auslösepunkt erweitert AgentSwing parallel mehrere kontextverwaltete Zweige und nutzt Lookahead-Routing, um die vielversprechendste Fortsetzung auszuwählen. Experimente über verschiedene Benchmarks und Agenten-Backbones hinweg zeigen, dass AgentSwing durchgängig starke statische Kontextverwaltungsmethoden übertrifft und oft deren Leistung mit bis zu dreimal weniger Interaktionsschritten erreicht oder übertrifft, während gleichzeitig die ultimative Leistungsgrenze langfristiger Web-Agenten verbessert wird. Über die empirischen Gewinne hinaus bietet der vorgeschlagene probabilistische Rahmen eine prinzipielle Betrachtungsweise zur Analyse und Gestaltung zukünftiger Kontextverwaltungsstrategien für langfristige Agenten.

English

As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.

AgentSwing: Adaptive parallele Kontextmanagement-Routing für Web-Agenten mit langem Planungshorizont

AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents

Zusammenfassung

Support