AgentSwing: Enrutamiento Adaptativo de Gestión de Contexto Paralelo para Agentes Web de Horizonte Largo

Resumen

A medida que los grandes modelos de lenguaje (LLM) evolucionan hacia agentes autónomos para la búsqueda de información de horizonte largo, la gestión de la capacidad de contexto finita se ha convertido en un cuello de botella crítico. Los métodos de gestión de contexto existentes suelen comprometerse con una única estrategia fija a lo largo de toda la trayectoria. Estos diseños estáticos pueden funcionar bien en algunos estados, pero no pueden adaptarse a medida que la utilidad y fiabilidad del contexto acumulado evolucionan durante la búsqueda de largo horizonte. Para formalizar este desafío, introducimos un marco probabilístico que caracteriza el éxito de largo horizonte a través de dos dimensiones complementarias: la eficiencia de búsqueda y la precisión terminal. Basándonos en esta perspectiva, proponemos AgentSwing, un marco de enrutamiento adaptativo y paralelo para la gestión de contexto, consciente del estado. En cada punto de activación, AgentSwing expande múltiples ramas con gestión de contexto en paralelo y utiliza un enrutamiento con visión anticipada para seleccionar la continuación más prometedora. Los experimentos en diversos puntos de referencia y con diferentes arquitecturas de agentes muestran que AgentSwing supera consistentemente a los sólidos métodos estáticos de gestión de contexto, a menudo igualando o superando su rendimiento con hasta 3 veces menos turnos de interacción, al tiempo que mejora el límite máximo de rendimiento último de los agentes web de horizonte largo. Más allá de las ganancias empíricas, el marco probabilístico propuesto proporciona una lente fundamentada para analizar y diseñar futuras estrategias de gestión de contexto para agentes de horizonte largo.

English

As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.

AgentSwing: Enrutamiento Adaptativo de Gestión de Contexto Paralelo para Agentes Web de Horizonte Largo

AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents

Resumen

Support