Flash-Searcher: Schnelle und effektive Web-Agenten durch DAG-basierte parallele Ausführung
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
papers.authors: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
papers.abstract
Große Sprachmodelle (LLMs) haben bemerkenswerte Fähigkeiten bei komplexen Denkaufgaben gezeigt, wenn sie mit externen Werkzeugen ausgestattet sind. Allerdings basieren aktuelle Frameworks überwiegend auf sequenzieller Verarbeitung, was zu ineffizienter Ausführung führt, insbesondere bei Aufgaben, die umfangreiche Werkzeuginteraktionen erfordern. Dieses Paper stellt Flash-Searcher vor, ein neuartiges paralleles Agenten-Reasoning-Framework, das das Ausführungsparadigma grundlegend von sequenziellen Ketten zu gerichteten azyklischen Graphen (DAGs) umgestaltet. Flash-Searcher zerlegt komplexe Aufgaben in Unteraufgaben mit expliziten Abhängigkeiten, wodurch die gleichzeitige Ausführung unabhängiger Denkpfade bei gleichzeitiger Wahrung logischer Einschränkungen ermöglicht wird. Durch dynamische Workflow-Optimierung verfeinert unser Framework kontinuierlich den Ausführungsgraphen basierend auf Zwischenergebnissen und integriert effektiv ein Zusammenfassungsmodul. Umfassende Bewertungen über mehrere Benchmarks hinweg zeigen, dass Flash-Searcher bestehende Ansätze durchweg übertrifft. Insbesondere erreicht es eine Genauigkeit von 67,7 % auf BrowseComp und 83 % auf xbench-DeepSearch, während es die Ausführungsschritte des Agenten im Vergleich zu aktuellen Frameworks um bis zu 35 % reduziert. Darüber hinaus beobachten wir, wenn diese parallele Reasoning-Pipeline in einzelne Modelle destilliert wird, erhebliche Leistungssteigerungen über diverse Backbone-Architekturen hinweg, was die Generalisierbarkeit unserer Methodik unterstreicht. Unsere Arbeit stellt somit einen bedeutenden Fortschritt im Design von Agentenarchitekturen dar und bietet ein skalierbareres und effizienteres Paradigma für komplexe Denkaufgaben.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.