ChatPaper.aiChatPaper

ExpSeek: Автономный поиск опыта для веб-агентов

ExpSeek: Self-Triggered Experience Seeking for Web Agents

January 13, 2026
Авторы: Wenyuan Zhang, Xinghua Zhang, Haiyang Yu, Shuaiyi Nie, Bingli Wu, Juwei Yue, Tingwen Liu, Yongbin Li
cs.AI

Аннотация

Вмешательство на основе опыта в веб-агентах представляет собой перспективную техническую парадигму, повышающую способности агентов к взаимодействию за счет предоставления ценных инсайтов из накопленного опыта. Однако существующие методы преимущественно пассивно внедряют опыт как глобальный контекст до выполнения задачи, с трудом адаптируясь к динамически меняющимся контекстным наблюдениям во время взаимодействия агента со средой. Мы предлагаем ExpSeek, который смещает фокус опыта в сторону проактивного поиска на пошаговом уровне: (1) оценку энтропийных порогов на уровне шага для определения времени вмешательства с использованием внутренних сигналов модели; (2) разработку специально адаптированного содержания опыта для каждого шага. Эксперименты на моделях Qwen3-8B и 32B в рамках четырех сложных бенчмарков веб-агентов демонстрируют, что ExpSeek достигает абсолютного улучшения на 9.3% и 7.5% соответственно. Наши эксперименты подтверждают осуществимость и преимущества использования энтропии в качестве сигнала самоактивации, а также показывают, что даже компактная модель опыта объемом 4B способна значительно повысить производительность более крупных агент-моделей.
English
Experience intervention in web agents emerges as a promising technical paradigm, enhancing agent interaction capabilities by providing valuable insights from accumulated experiences. However, existing methods predominantly inject experience passively as global context before task execution, struggling to adapt to dynamically changing contextual observations during agent-environment interaction. We propose ExpSeek, which shifts experience toward step-level proactive seeking: (1) estimating step-level entropy thresholds to determine intervention timing using the model's intrinsic signals; (2) designing step-level tailor-designed experience content. Experiments on Qwen3-8B and 32B models across four challenging web agent benchmarks demonstrate that ExpSeek achieves absolute improvements of 9.3% and 7.5%, respectively. Our experiments validate the feasibility and advantages of entropy as a self-triggering signal, reveal that even a 4B small-scale experience model can significantly boost the performance of larger agent models.
PDF151January 16, 2026