ChatPaper.aiChatPaper

ExpSeek: Webエージェントのための自己トリガー経験探索

ExpSeek: Self-Triggered Experience Seeking for Web Agents

January 13, 2026
著者: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI

要旨

経験介入は、蓄積された経験から得られた有益な知見を提供することでエージェントの対話能力を強化する、有望な技術パラダイムとして登場している。しかし既存手法は、タスク実行前に経験を受動的にグローバルコンテキストとして注入する方式が主流であり、エージェントと環境の相互作用中に動的に変化する文脈観測への適応が困難である。本研究では、経験介入をステップ単位の能動的検索へ転換するExpSeekを提案する:(1) モデルの内在信号を用いてステップ単位のエントロピー閾値を推定し介入タイミングを決定、(2) ステップ単位で特化設計された経験コンテンツの設計。4つの難易度の高いWebエージェントベンチマークにおけるQwen3-8Bおよび32Bモデルでの実験により、ExpSeekがそれぞれ9.3%、7.5%の絶対精度向上を達成することを実証した。本実験はエントロピーが自己トリガー信号として有効であることを検証し、4B規模の小規模経験モデルでも大規模エージェントモデルの性能を大幅に向上させ得ることを明らかにした。
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
PDF151January 16, 2026