Flash-Searcher: Agentes Web Rápidos e Eficazes por meio de Execução Paralela Baseada em DAG
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
Autores: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
Resumo
Modelos de linguagem de grande escala (LLMs) têm demonstrado capacidades notáveis em tarefas de raciocínio complexo quando equipados com ferramentas externas. No entanto, os frameworks atuais dependem predominantemente de processamento sequencial, levando a uma execução ineficiente, especialmente para tarefas que exigem interação extensiva com ferramentas. Este artigo apresenta o Flash-Searcher, um novo framework de raciocínio de agentes paralelos que redefine fundamentalmente o paradigma de execução de cadeias sequenciais para grafos acíclicos direcionados (DAGs). O Flash-Searcher decompõe tarefas complexas em subtarefas com dependências explícitas, permitindo a execução concorrente de caminhos de raciocínio independentes enquanto mantém restrições lógicas. Através da otimização dinâmica de fluxo de trabalho, nosso framework refina continuamente o grafo de execução com base em resultados intermediários, integrando efetivamente um módulo de resumo. Avaliações abrangentes em múltiplos benchmarks demonstram que o Flash-Searcher supera consistentemente as abordagens existentes. Especificamente, ele alcança 67,7% de precisão no BrowseComp e 83% no xbench-DeepSearch, enquanto reduz os passos de execução do agente em até 35% em comparação com os frameworks atuais. Além disso, ao destilar esse pipeline de raciocínio paralelo em modelos únicos, observamos ganhos substanciais de desempenho em diversas arquiteturas de backbone, destacando a generalizabilidade de nossa metodologia. Nosso trabalho representa, portanto, um avanço significativo no design de arquitetura de agentes, oferecendo um paradigma mais escalável e eficiente para tarefas de raciocínio complexo.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.