Flash-Searcher: Быстрые и эффективные веб-агенты на основе параллельного выполнения с использованием DAG
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
Авторы: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
Аннотация
Крупные языковые модели (LLM) демонстрируют впечатляющие способности в выполнении сложных задач рассуждения при использовании внешних инструментов. Однако современные подходы преимущественно полагаются на последовательную обработку, что приводит к неэффективному выполнению, особенно для задач, требующих интенсивного взаимодействия с инструментами. В данной статье представлен Flash-Searcher — новый фреймворк параллельного рассуждения агентов, который кардинально переосмысливает парадигму выполнения, переходя от последовательных цепочек к направленным ациклическим графам (DAG). Flash-Searcher разбивает сложные задачи на подзадачи с явными зависимостями, позволяя параллельное выполнение независимых путей рассуждения при сохранении логических ограничений. Благодаря динамической оптимизации рабочего процесса, наш фреймворк непрерывно уточняет граф выполнения на основе промежуточных результатов, эффективно интегрируя модуль суммирования. Комплексные оценки на множестве бенчмарков показывают, что Flash-Searcher стабильно превосходит существующие подходы. В частности, он достигает точности 67,7% на BrowseComp и 83% на xbench-DeepSearch, сокращая количество шагов выполнения агента до 35% по сравнению с текущими фреймворками. Кроме того, при дистилляции этого параллельного конвейера рассуждения в отдельные модели мы наблюдаем значительное улучшение производительности на различных архитектурах, что подчеркивает универсальность нашей методологии. Таким образом, наша работа представляет собой значительный шаг вперед в проектировании архитектуры агентов, предлагая более масштабируемую и эффективную парадигму для выполнения сложных задач рассуждения.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.