ChatPaper.aiChatPaper

ExpSeek: Zelf-geactiveerde Ervaringsverwerving voor Webagentschappen

ExpSeek: Self-Triggered Experience Seeking for Web Agents

January 13, 2026
Auteurs: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI

Samenvatting

Ervaringsinterventie bij webagentschappen vormt een veelbelovend technisch paradigma, dat de interactiecapaciteiten van agents versterkt door waardevolle inzichten uit opgebouwde ervaringen aan te reiken. Bestaande methoden injecteren ervaring echter voornamelijk passief als globale context vóór taakuitvoering, waardoor ze moeite hebben zich aan te passen aan dynamisch veranderende contextuele observaties tijdens de agent-omgeving-interactie. Wij stellen ExpSeek voor, dat ervaring verschuift naar proactieve zoekacties op stapniveau: (1) het schatten van entropiedrempels per stap om het interventietijdstip te bepalen met behulp van de intrinsieke signalen van het model; (2) het ontwerpen van stapniveau-ervaringsinhoud die op maat is gemaakt. Experimenten met Qwen3-8B- en 32B-modellen op vier uitdagende webagent-benchmarks tonen aan dat ExpSeek absolute verbeteringen van respectievelijk 9,3% en 7,5% bereikt. Onze experimenten valideren de haalbaarheid en voordelen van entropie als een zelftriggerend signaal, en tonen aan dat zelfs een kleinschalig ervaringsmodel van 4B de prestaties van grotere agentmodellen aanzienlijk kan verbeteren.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
PDF151January 16, 2026