ChatPaper.aiChatPaper

ExpSeek: Selbstgesteuertes Erfahrungssammeln für Web-Agenten

ExpSeek: Self-Triggered Experience Seeking for Web Agents

January 13, 2026
papers.authors: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI

papers.abstract

Die Erfahrungsintervention bei Web-Agenten erweist sich als vielversprechendes technisches Paradigma, das die Interaktionsfähigkeiten von Agenten durch die Bereitstellung wertvoller Erkenntnisse aus gesammelten Erfahrungen verbessert. Bestehende Methoden injizieren Erfahrungen jedoch überwiegend passiv als globalen Kontext vor der Aufgabenausführung und haben Schwierigkeiten, sich an dynamisch verändernde Kontextbeobachtungen während der Agent-Umgebungs-Interaktion anzupassen. Wir schlagen ExpSeek vor, das Erfahrungen hin zu einer schrittweisen proaktiven Suche verschiebt: (1) Schätzung schrittweiser Entropiegrenzwerte zur Bestimmung des Interventionszeitpunkts unter Verwendung intrinsischer Signale des Modells; (2) Gestaltung maßgeschneiderter Erfahrungsinhalte auf Schrittebene. Experimente mit Qwen3-8B- und 32B-Modellen über vier anspruchsvolle Web-Agenten-Benchmarks zeigen, dass ExpSeek absolute Verbesserungen von 9,3 % bzw. 7,5 % erzielt. Unsere Experimente validieren die Machbarkeit und Vorteile von Entropie als selbstauslösendes Signal und zeigen, dass selbst ein kleines Erfahrungsmodell mit 4B die Leistung größerer Agentenmodelle signifikant steigern kann.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
PDF151January 16, 2026