AgentSwing: Roteamento Adaptativo de Gerenciamento de Contexto Paralelo para Agentes Web de Longo Horizonte

Resumo

À medida que os modelos de linguagem de grande escala (LLMs) evoluem para agentes autónomos de busca de informação de longo horizonte, a gestão da capacidade de contexto finito tornou-se um gargalo crítico. Os métodos existentes de gestão de contexto normalmente comprometem-se com uma única estratégia fixa ao longo de toda a trajetória. Estes desenhos estáticos podem funcionar bem em alguns estados, mas não conseguem adaptar-se à medida que a utilidade e a confiabilidade do contexto acumulado evoluem durante uma busca de longo horizonte. Para formalizar este desafio, introduzimos um quadro probabilístico que caracteriza o sucesso de longo horizonte através de duas dimensões complementares: eficiência de busca e precisão terminal. Com base nesta perspetiva, propomos o AgentSwing, um quadro de encaminhamento de gestão de contexto paralelo e adaptativo, consciente do estado. Em cada ponto de ativação, o AgentSwing expande múltiplos ramos geridos por contexto em paralelo e usa encaminhamento com antevisão (lookahead) para selecionar a continuação mais promissora. Experiências em diversos benchmarks e arquiteturas de agentes mostram que o AgentSwing supera consistentemente métodos estáticos robustos de gestão de contexto, frequentemente igualando ou excedendo o seu desempenho com até 3 vezes menos turnos de interação, enquanto também melhora o limite máximo de desempenho final de agentes web de longo horizonte. Para além dos ganhos empíricos, o quadro probabilístico proposto fornece uma lente fundamentada para analisar e projetar futuras estratégias de gestão de contexto para agentes de longo horizonte.

English

As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to 3times fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.

AgentSwing: Roteamento Adaptativo de Gerenciamento de Contexto Paralelo para Agentes Web de Longo Horizonte

AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents

Resumo

Support