ExpSeek: Búsqueda Autónoma de Experiencias para Agentes Web
ExpSeek: Self-Triggered Experience Seeking for Web Agents
January 13, 2026
Autores: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI
Resumen
La intervención experiencial en agentes web surge como un paradigma técnico prometedor, mejorando las capacidades de interacción de los agentes mediante la provisión de conocimientos valiosos derivados de experiencias acumuladas. Sin embargo, los métodos existentes inyectan predominantemente la experiencia de forma pasiva como contexto global antes de la ejecución de la tarea, luchando por adaptarse a las observaciones contextuales dinámicamente cambiantes durante la interacción agente-entorno. Proponemos ExpSeek, que desplaza la experiencia hacia una búsqueda proactiva a nivel de paso: (1) estimando umbrales de entropía a nivel de paso para determinar el momento de intervención utilizando las señales intrínsecas del modelo; (2) diseñando contenido experiencial específicamente adaptado a nivel de paso. Los experimentos en los modelos Qwen3-8B y 32B a través de cuatro benchmarks desafiantes para agentes web demuestran que ExpSeek logra mejoras absolutas del 9.3% y 7.5%, respectivamente. Nuestros experimentos validan la viabilidad y ventajas de la entropía como señal de auto-activación, y revelan que incluso un modelo de experiencia a pequeña escala de 4B puede potenciar significativamente el rendimiento de modelos de agentes más grandes.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.