Flash-Searcher : Agents Web Rapides et Efficaces grâce à une Exécution Parallèle Basée sur les Graphes Orientés Acycliques
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
September 29, 2025
papers.authors: Tianrui Qin, Qianben Chen, Sinuo Wang, He Xing, King Zhu, He Zhu, Dingfeng Shi, Xinxin Liu, Ge Zhang, Jiaheng Liu, Yuchen Eleanor Jiang, Xitong Gao, Wangchunshu Zhou
cs.AI
papers.abstract
Les grands modèles de langage (LLMs) ont démontré des capacités remarquables dans les tâches de raisonnement complexe lorsqu'ils sont équipés d'outils externes. Cependant, les cadres actuels reposent principalement sur un traitement séquentiel, ce qui entraîne une exécution inefficace, en particulier pour les tâches nécessitant une interaction intensive avec des outils. Cet article présente Flash-Searcher, un nouveau cadre de raisonnement d'agents parallèles qui réinvente fondamentalement le paradigme d'exécution, passant de chaînes séquentielles à des graphes acycliques dirigés (DAGs). Flash-Searcher décompose les tâches complexes en sous-tâches avec des dépendances explicites, permettant l'exécution concurrente de chemins de raisonnement indépendants tout en respectant les contraintes logiques. Grâce à l'optimisation dynamique des workflows, notre cadre affine continuellement le graphe d'exécution en fonction des résultats intermédiaires, intégrant efficacement un module de synthèse. Des évaluations approfondies sur plusieurs benchmarks montrent que Flash-Searcher surpasse systématiquement les approches existantes. Plus précisément, il atteint une précision de 67,7 % sur BrowseComp et de 83 % sur xbench-DeepSearch, tout en réduisant les étapes d'exécution des agents jusqu'à 35 % par rapport aux cadres actuels. De plus, lorsque ce pipeline de raisonnement parallèle est distillé en modèles uniques, nous observons des gains de performance substantiels sur diverses architectures de base, soulignant la généralisabilité de notre méthodologie. Notre travail représente ainsi une avancée significative dans la conception d'architectures d'agents, offrant un paradigme plus évolutif et efficace pour les tâches de raisonnement complexe.
English
Large language models (LLMs) have demonstrated remarkable capabilities in
complex reasoning tasks when equipped with external tools. However, current
frameworks predominantly rely on sequential processing, leading to inefficient
execution particularly for tasks requiring extensive tool interaction. This
paper introduces Flash-Searcher, a novel parallel agent reasoning framework
that fundamentally reimagines the execution paradigm from sequential chains to
directed acyclic graphs (DAGs). Flash-Searcher decomposes complex tasks into
subtasks with explicit dependencies, enabling concurrent execution of
independent reasoning paths while maintaining logical constraints. Through
dynamic workflow optimization, our framework continuously refines the execution
graph based on intermediate results, effectively integrating summary module.
Comprehensive evaluations across multiple benchmarks demonstrate that
Flash-Searcher consistently outperforms existing approaches. Specifically, it
achieves 67.7% accuracy on BrowseComp and 83% on xbench-DeepSearch, while
reducing agent execution steps by up to 35% compared to current frameworks.
Furthermore, when distilling this parallel reasoning pipeline into single
models, we observe substantial performance gains across diverse backbone
architectures, underscoring the generalizability of our methodology. Our work
thus represents a significant advance in agent architecture design, offering a
more scalable and efficient paradigm for complex reasoning tasks.