Flash-Searcher: Agenti Web Veloci ed Efficaci tramite Esecuzione Parallela Basata su DAG
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
Autori: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
Abstract
I grandi modelli linguistici (LLM) hanno dimostrato capacità notevoli in compiti di ragionamento complesso quando dotati di strumenti esterni. Tuttavia, gli attuali framework si basano principalmente su un'elaborazione sequenziale, portando a un'esecuzione inefficiente, specialmente per compiti che richiedono un'interazione estesa con strumenti. Questo articolo introduce Flash-Searcher, un innovativo framework di ragionamento parallelo per agenti che ridefinisce radicalmente il paradigma di esecuzione da catene sequenziali a grafi aciclici diretti (DAG). Flash-Searcher scompone compiti complessi in sottotask con dipendenze esplicite, consentendo l'esecuzione concorrente di percorsi di ragionamento indipendenti mantenendo i vincoli logici. Attraverso l'ottimizzazione dinamica del flusso di lavoro, il nostro framework perfeziona continuamente il grafo di esecuzione basandosi sui risultati intermedi, integrando efficacemente un modulo di riepilogo. Valutazioni approfondite su più benchmark dimostrano che Flash-Searcher supera costantemente gli approcci esistenti. In particolare, raggiunge un'accuratezza del 67,7% su BrowseComp e dell'83% su xbench-DeepSearch, riducendo i passi di esecuzione degli agenti fino al 35% rispetto ai framework attuali. Inoltre, quando si distilla questa pipeline di ragionamento parallelo in modelli singoli, si osservano sostanziali miglioramenti delle prestazioni su diverse architetture di base, sottolineando la generalizzabilità della nostra metodologia. Il nostro lavoro rappresenta quindi un significativo progresso nella progettazione dell'architettura degli agenti, offrendo un paradigma più scalabile ed efficiente per compiti di ragionamento complesso.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.