Flash-Searcher: Snelle en effectieve webagentschappen via parallelle uitvoering gebaseerd op DAG's
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
Auteurs: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
Samenvatting
Grote taalmodellen (LLMs) hebben opmerkelijke capaciteiten getoond in complexe redeneertaken wanneer ze zijn uitgerust met externe tools. Huidige frameworks vertrouwen echter voornamelijk op sequentiële verwerking, wat leidt tot inefficiënte uitvoering, vooral voor taken die uitgebreide toolinteractie vereisen. Dit artikel introduceert Flash-Searcher, een nieuw parallel agent-reasoning framework dat het uitvoeringsparadigma fundamenteel herdenkt van sequentiële ketens naar gerichte acyclische grafieken (DAGs). Flash-Searcher deconstrueert complexe taken in subtaken met expliciete afhankelijkheden, waardoor gelijktijdige uitvoering van onafhankelijke redeneerpaden mogelijk is, terwijl logische beperkingen worden gehandhaafd. Door dynamische workflowoptimalisatie verfijnt ons framework continu de uitvoeringsgrafiek op basis van tussentijdse resultaten en integreert het effectief een samenvattingsmodule. Uitgebreide evaluaties over meerdere benchmarks tonen aan dat Flash-Searcher consistent beter presteert dan bestaande benaderingen. Specifiek behaalt het een nauwkeurigheid van 67,7% op BrowseComp en 83% op xbench-DeepSearch, terwijl het het aantal agent-uitvoeringsstappen met tot wel 35% vermindert in vergelijking met huidige frameworks. Bovendien, wanneer we deze parallelle redeneerpijplijn destilleren in enkele modellen, observeren we aanzienlijke prestatieverbeteringen over diverse backbone-architecturen, wat de generaliseerbaarheid van onze methodologie onderstreept. Ons werk vertegenwoordigt dus een significante vooruitgang in het ontwerp van agent-architectuur, en biedt een schaalbaarder en efficiënter paradigma voor complexe redeneertaken.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.