WideSeek: Vooruitgang in Breed Onderzoek via Multi-Agent Schaling
WideSeek: Advancing Wide Research via Multi-Agent Scaling
February 2, 2026
Auteurs: Ziyang Huang, Haolin Ren, Xiaowei Yuan, Jiawei Wang, Zhongtao Jiang, Kun Xu, Shizhu He, Jun Zhao, Kang Liu
cs.AI
Samenvatting
Zoekintelligentie evolueert van Diep Onderzoek naar Breed Onderzoek, een paradigma dat essentieel is voor het parallel ophalen en synthetiseren van uitgebreide informatie onder complexe beperkingen. De vooruitgang op dit gebied wordt echter belemmerd door het gebrek aan toegewijde benchmarks en optimalisatiemethodologieën voor zoekbreedte. Om deze uitdagingen aan te pakken, duiken we diep in Breed Onderzoek vanuit twee perspectieven: Datapijplijn en Agentoptimalisatie. Ten eerste produceren we WideSeekBench, een General Broad Information Seeking (GBIS)-benchmark die via een rigoureuze meerfasige datapijplijn is opgebouwd om diversiteit te garanderen in doelinformatievolume, logische beperkingen en domeinen. Ten tweede introduceren we WideSeek, een dynamische hiërarchische multi-agentarchitectuur die autonoom parallelle subagenten kan splitsen op basis van taakvereisten. Verder ontwerpen we een uniform trainingsraamwerk dat multi-agenttrajecten lineariseert en het systeem optimaliseert met end-to-end reinforcement learning. Experimentele resultaten tonen de effectiviteit van WideSeek en multi-agent RL aan, en benadrukken dat het schalen van het aantal agenten een veelbelovende richting is voor de verdere ontwikkeling van het Breed Onderzoek-paradigma.
English
Search intelligence is evolving from Deep Research to Wide Research, a paradigm essential for retrieving and synthesizing comprehensive information under complex constraints in parallel. However, progress in this field is impeded by the lack of dedicated benchmarks and optimization methodologies for search breadth. To address these challenges, we take a deep dive into Wide Research from two perspectives: Data Pipeline and Agent Optimization. First, we produce WideSeekBench, a General Broad Information Seeking (GBIS) benchmark constructed via a rigorous multi-phase data pipeline to ensure diversity across the target information volume, logical constraints, and domains. Second, we introduce WideSeek, a dynamic hierarchical multi-agent architecture that can autonomously fork parallel sub-agents based on task requirements. Furthermore, we design a unified training framework that linearizes multi-agent trajectories and optimizes the system using end-to-end RL. Experimental results demonstrate the effectiveness of WideSeek and multi-agent RL, highlighting that scaling the number of agents is a promising direction for advancing the Wide Research paradigm.