WebLeaper: Повышение эффективности и действенности веб-агентов за счет обеспечения информационно насыщенного поиска
WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking
October 28, 2025
Авторы: Zhengwei Tao, Haiyang Shen, Baixuan Li, Wenbiao Yin, Jialong Wu, Kuan Li, Zhongwang Zhang, Huifeng Yin, Rui Ye, Liwen Zhang, Xinyu Wang, Pengjun Xie, Jingren Zhou, Yong Jiang
cs.AI
Аннотация
Агенты на основе больших языковых моделей (LLM) стали прорывным подходом к решению открытых задач, при этом информационный поиск (ИП) является ключевой способностью, обеспечивающей автономные рассуждения и принятие решений. В то время как предыдущие исследования в основном были сосредоточены на повышении глубины извлечения данных, мы наблюдаем, что современные ИП-агенты часто страдают от низкой эффективности поиска, что, в свою очередь, ограничивает общую производительность. Ключевым фактором, лежащим в основе этой неэффективности, является разреженность целевых сущностей в обучающих задачах, что ограничивает возможности агентов по обучению и обобщению эффективных поисковых поведений. Для решения этих проблем мы предлагаем WebLeaper — фреймворк для построения ИП-задач с высоким охватом и генерации эффективных траекторий решений. Мы формулируем ИП как древовидную проблему рассуждений, что позволяет внедрить значительно большее множество целевых сущностей в ограниченный контекст. Используя курируемые таблицы Википедии, мы предлагаем три варианта синтеза ИП-задач — Basic, Union и Reverse-Union — для систематического повышения как эффективности, так и результативности ИП. Наконец, мы курируем обучающие траектории, оставляя только те, которые одновременно точны и эффективны, гарантируя оптимизацию модели как на корректность, так и на производительность поиска. Многочисленные эксперименты в базовых и комплексных условиях, проведенные на пяти ИП-бенчмарках — BrowserComp, GAIA, xbench-DeepSearch, WideSearch и Seal-0 — демонстрируют, что наш метод стабильно достигает улучшений как по результативности, так и по эффективности по сравнению с сильными базовыми методами.
English
Large Language Model (LLM)-based agents have emerged as a transformative
approach for open-ended problem solving, with information seeking (IS) being a
core capability that enables autonomous reasoning and decision-making. While
prior research has largely focused on improving retrieval depth, we observe
that current IS agents often suffer from low search efficiency, which in turn
constrains overall performance. A key factor underlying this inefficiency is
the sparsity of target entities in training tasks, which limits opportunities
for agents to learn and generalize efficient search behaviors. To address these
challenges, we propose WebLeaper, a framework for constructing high-coverage IS
tasks and generating efficient solution trajectories. We formulate IS as a
tree-structured reasoning problem, enabling a substantially larger set of
target entities to be embedded within a constrained context. Leveraging curated
Wikipedia tables, we propose three variants for synthesizing IS tasks, Basic,
Union, and Reverse-Union, to systematically increase both IS efficiency and
efficacy. Finally, we curate training trajectories by retaining only those that
are simultaneously accurate and efficient, ensuring that the model is optimized
for both correctness and search performance. Extensive experiments on both
basic and comprehensive settings, conducted on five IS benchmarks, BrowserComp,
GAIA, xbench-DeepSearch, WideSearch, and Seal-0, demonstrate that our method
consistently achieves improvements in both effectiveness and efficiency over
strong baselines.