Flash-Searcher: Agentes Web Rápidos y Efectivos mediante Ejecución Paralela Basada en Grafos Acíclicos Dirigidos (DAG)
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
Autores: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
Resumen
Los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) han demostrado capacidades notables en tareas de razonamiento complejo cuando se equipan con herramientas externas. Sin embargo, los marcos actuales dependen predominantemente del procesamiento secuencial, lo que conduce a una ejecución ineficiente, especialmente para tareas que requieren una interacción extensa con herramientas. Este artículo presenta Flash-Searcher, un novedoso marco de razonamiento de agentes paralelos que replantea fundamentalmente el paradigma de ejecución, pasando de cadenas secuenciales a grafos acíclicos dirigidos (DAGs, por sus siglas en inglés). Flash-Searcher descompone tareas complejas en subtareas con dependencias explícitas, permitiendo la ejecución concurrente de rutas de razonamiento independientes mientras se mantienen las restricciones lógicas. A través de la optimización dinámica del flujo de trabajo, nuestro marco refina continuamente el grafo de ejecución basándose en resultados intermedios, integrando eficazmente un módulo de resumen. Evaluaciones exhaustivas en múltiples benchmarks demuestran que Flash-Searcher supera consistentemente los enfoques existentes. Específicamente, logra un 67,7% de precisión en BrowseComp y un 83% en xbench-DeepSearch, mientras reduce los pasos de ejecución del agente hasta en un 35% en comparación con los marcos actuales. Además, al destilar esta canalización de razonamiento paralelo en modelos individuales, observamos mejoras sustanciales en el rendimiento en diversas arquitecturas base, destacando la generalizabilidad de nuestra metodología. Nuestro trabajo representa, por tanto, un avance significativo en el diseño de arquitecturas de agentes, ofreciendo un paradigma más escalable y eficiente para tareas de razonamiento complejo.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.