ChatPaper.aiChatPaper

ExpSeek : Recherche d'expérience auto-déclenchée pour les agents web

ExpSeek: Self-Triggered Experience Seeking for Web Agents

January 13, 2026
papers.authors: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI

papers.abstract

L'intervention par l'expérience dans les agents web émerge comme un paradigme technique prometteur, améliorant les capacités d'interaction des agents en fournissant des insights précieux issus d'expériences accumulées. Cependant, les méthodes existantes injectent principalement l'expérience passivement comme contexte global avant l'exécution des tâches, peinant à s'adapter aux observations contextuelles dynamiquement changeantes durant l'interaction agent-environnement. Nous proposons ExpSeek, qui oriente l'expérience vers une recherche proactive au niveau des étapes : (1) en estimant des seuils d'entropie par étape pour déterminer le timing d'intervention en utilisant les signaux intrinsèques du modèle ; (2) en concevant un contenu expérientiel sur mesure au niveau de l'étape. Les expériences sur les modèles Qwen3-8B et 32B à travers quatre benchmarks exigeants pour agents web démontrent qu'ExpSeek obtient des améliorations absolues de 9,3 % et 7,5 % respectivement. Nos expériences valident la faisabilité et les avantages de l'entropie comme signal d'auto-déclenchement, et révèlent qu'un modèle d'expérience de petite échelle (4B) peut significativement booster les performances de modèles d'agents plus grands.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
PDF151January 16, 2026