WebWeaver: Structureren van web-schaal bewijs met dynamische overzichten voor open-eindig diepgaand onderzoek
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research
September 16, 2025
Auteurs: Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, Pengjun Xie, Fei Huang, Jun Zhang, Jingren Zhou
cs.AI
Samenvatting
Dit artikel behandelt open-ended deep research (OEDR), een complexe uitdaging waarbij AI-agenten grootschalige informatie van het web moeten synthetiseren tot inzichtelijke rapporten. Huidige benaderingen kampen met tweeledige beperkingen: statische onderzoekspijplijnen die planning loskoppelen van het verzamelen van bewijs, en one-shot generatieparadigma's die gemakkelijk lijden onder lang-contextfouten zoals "verlies in het midden" en hallucinaties. Om deze uitdagingen aan te pakken, introduceren we WebWeaver, een nieuw dual-agent framework dat het menselijke onderzoeksproces nabootst. De planner opereert in een dynamische cyclus, waarbij het verzamelen van bewijs iteratief wordt afgewisseld met het optimaliseren van een overzicht om een uitgebreid, bron-gebaseerd overzicht te produceren dat is gekoppeld aan een geheugenbank van bewijs. De schrijver voert vervolgens een hiërarchisch ophaal- en schrijfproces uit, waarbij het rapport sectie voor sectie wordt samengesteld. Door gericht alleen het nodige bewijs uit de geheugenbank op te halen voor elk deel, worden lang-contextproblemen effectief gemitigeerd. Ons framework vestigt een nieuwe state-of-the-art op belangrijke OEDR benchmarks, waaronder DeepResearch Bench, DeepConsult en DeepResearchGym. Deze resultaten valideren onze mensgerichte, iteratieve methodologie, en tonen aan dat adaptieve planning en gerichte synthese cruciaal zijn voor het produceren van hoogwaardige, betrouwbare en goed gestructureerde rapporten.
English
This paper tackles open-ended deep research (OEDR), a complex challenge where
AI agents must synthesize vast web-scale information into insightful reports.
Current approaches are plagued by dual-fold limitations: static research
pipelines that decouple planning from evidence acquisition and one-shot
generation paradigms that easily suffer from long-context failure issues like
"loss in the middle" and hallucinations. To address these challenges, we
introduce WebWeaver, a novel dual-agent framework that emulates the human
research process. The planner operates in a dynamic cycle, iteratively
interleaving evidence acquisition with outline optimization to produce a
comprehensive, source-grounded outline linking to a memory bank of evidence.
The writer then executes a hierarchical retrieval and writing process,
composing the report section by section. By performing targeted retrieval of
only the necessary evidence from the memory bank for each part, it effectively
mitigates long-context issues. Our framework establishes a new state-of-the-art
across major OEDR benchmarks, including DeepResearch Bench, DeepConsult, and
DeepResearchGym. These results validate our human-centric, iterative
methodology, demonstrating that adaptive planning and focused synthesis are
crucial for producing high-quality, reliable, and well-structured reports.