ExpSeek: 웹 에이전트를 위한 자동 트리거 경험 탐색
ExpSeek: Self-Triggered Experience Seeking for Web Agents
January 13, 2026
저자: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI
초록
경험 인터벤션은 축적된 경험에서 가치 있는 통찰력을 제공하여 에이전트 상호작용 능력을 향상시키는 유망한 기술 패러다임으로 부상하고 있습니다. 그러나 기존 방법들은 주로 과제 수행 전에 경험을 전역 컨텍스트로 수동적으로 주입하며, 에이전트-환경 상호작용 과정에서 동적으로 변화하는 상황 관측에 적응하는 데 어려움을 겪습니다. 본 연구는 경험을 단계별 능동적 탐색으로 전환하는 ExpSeek를 제안합니다: (1) 모델의 내재적 신호를 활용하여 단계별 엔트로피 임계값을 추정하여 인터벤션 시점을 결정하고, (2) 단계별 맞춤형 경험 콘텐츠를 설계합니다. 4가지 도전적인 웹 에이전트 벤치마크에서 Qwen3-8B 및 32B 모델을 대상으로 한 실험 결과, ExpSeek는 각각 9.3%, 7.5%의 절대적 성능 향상을 달성했습니다. 우리의 실험은 엔트로피가 자기-트리거 신호로서의 타당성과 장점을 입증하며, 4B 규모의 소형 경험 모델만으로도 대규모 에이전트 모델의 성능을 크게 향상시킬 수 있음을 보여줍니다.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.