Flash-Searcher: Agentes Web Rápidos e Eficazes por meio de Execução Paralela Baseada em DAG

Resumo

Modelos de linguagem de grande escala (LLMs) têm demonstrado capacidades notáveis em tarefas de raciocínio complexo quando equipados com ferramentas externas. No entanto, os frameworks atuais dependem predominantemente de processamento sequencial, levando a uma execução ineficiente, especialmente para tarefas que exigem interação extensiva com ferramentas. Este artigo apresenta o Flash-Searcher, um novo framework de raciocínio de agentes paralelos que redefine fundamentalmente o paradigma de execução de cadeias sequenciais para grafos acíclicos direcionados (DAGs). O Flash-Searcher decompõe tarefas complexas em subtarefas com dependências explícitas, permitindo a execução concorrente de caminhos de raciocínio independentes enquanto mantém restrições lógicas. Através da otimização dinâmica de fluxo de trabalho, nosso framework refina continuamente o grafo de execução com base em resultados intermediários, integrando efetivamente um módulo de resumo. Avaliações abrangentes em múltiplos benchmarks demonstram que o Flash-Searcher supera consistentemente as abordagens existentes. Especificamente, ele alcança 67,7% de precisão no BrowseComp e 83% no xbench-DeepSearch, enquanto reduz os passos de execução do agente em até 35% em comparação com os frameworks atuais. Além disso, ao destilar esse pipeline de raciocínio paralelo em modelos únicos, observamos ganhos substanciais de desempenho em diversas arquiteturas de backbone, destacando a generalizabilidade de nossa metodologia. Nosso trabalho representa, portanto, um avanço significativo no design de arquitetura de agentes, oferecendo um paradigma mais escalável e eficiente para tarefas de raciocínio complexo.

English

Large language models (LLMs) have demonstrated remarkable capabilities in complex reasoning tasks when equipped with external tools. However, current frameworks predominantly rely on sequential processing, leading to inefficient execution particularly for tasks requiring extensive tool interaction. This paper introduces Flash-Searcher, a novel parallel agent reasoning framework that fundamentally reimagines the execution paradigm from sequential chains to directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into subtasks with explicit dependencies, enabling concurrent execution of independent reasoning paths while maintaining logical constraints. Through dynamic workflow optimization, our framework continuously refines the execution graph based on intermediate results, effectively integrating summary module. Comprehensive evaluations across multiple benchmarks demonstrate that Flash-Searcher consistently outperforms existing approaches. Specifically, it achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while reducing agent execution steps by up to 35% compared to current frameworks. Furthermore, when distilling this parallel reasoning pipeline into single models, we observe substantial performance gains across diverse backbone architectures, underscoring the generalizability of our methodology. Our work thus represents a significant advance in agent architecture design, offering a more scalable and efficient paradigm for complex reasoning tasks.

Flash-Searcher: Agentes Web Rápidos e Eficazes por meio de Execução Paralela Baseada em DAG

Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution

Resumo

Support