ExpSeek: Ricerca Esperienziale Auto-Avviata per Agenti Web
ExpSeek: Self-Triggered Experience Seeking for Web Agents
January 13, 2026
Autori: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI
Abstract
L'intervento esperienziale negli agenti web emerge come un paradigma tecnico promettente, potenziando le capacità interattive degli agenti attraverso l'integrazione di insight preziosi derivanti da esperienze accumulate. Tuttavia, i metodi esistenti iniettano principalmente l'esperienza in modo passivo come contesto globale prima dell'esecuzione del compito, mostrando difficoltà nell'adattarsi alle osservazioni contestuali in evoluzione dinamica durante l'interazione agente-ambiente. Proponiamo ExpSeek, che sposta l'esperienza verso una ricerca proattiva a livello di step: (1) stimando soglie di entropia a livello di step per determinare il timing d'intervento mediante segnali intrinseci del modello; (2) progettando contenuti esperienziali su misura per ogni step. Esperimenti condotti sui modelli Qwen3-8B e 32B su quattro benchmark impegnativi per agenti web dimostrano che ExpSeek raggiunge miglioramenti assoluti rispettivamente del 9,3% e 7,5%. I nostri esperimenti convalidano la fattibilità e i vantaggi dell'entropia come segnale di auto-attivazione, rivelando che persino un modello esperienziale di piccole dimensioni (4B) può potenziare significativamente le prestazioni di modelli agente più grandi.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.