WebWeaver: Strutturazione di Prove su Scala Web con Strutture Dinamiche per Ricerche Approfondite e Aperte
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research
September 16, 2025
Autori: Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, Pengjun Xie, Fei Huang, Jun Zhang, Jingren Zhou
cs.AI
Abstract
Questo articolo affronta la ricerca approfondita a ciclo aperto (OEDR), una sfida complessa in cui gli agenti di intelligenza artificiale devono sintetizzare vaste informazioni su scala web in report approfonditi. Gli approcci attuali sono afflitti da limitazioni duplici: pipeline di ricerca statiche che separano la pianificazione dall'acquisizione di prove e paradigmi di generazione one-shot che facilmente soffrono di problemi di fallimento del contesto lungo, come la "perdita nel mezzo" e le allucinazioni. Per affrontare queste sfide, introduciamo WebWeaver, un nuovo framework a doppio agente che emula il processo di ricerca umano. Il pianificatore opera in un ciclo dinamico, intervallando iterativamente l'acquisizione di prove con l'ottimizzazione della struttura per produrre una struttura completa e basata su fonti, collegata a una banca di memoria delle prove. Lo scrittore esegue quindi un processo gerarchico di recupero e scrittura, componendo il report sezione per sezione. Eseguendo il recupero mirato solo delle prove necessarie dalla banca di memoria per ogni parte, mitiga efficacemente i problemi del contesto lungo. Il nostro framework stabilisce un nuovo stato dell'arte nei principali benchmark OEDR, tra cui DeepResearch Bench, DeepConsult e DeepResearchGym. Questi risultati convalidano la nostra metodologia iterativa e centrata sull'uomo, dimostrando che la pianificazione adattiva e la sintesi focalizzata sono cruciali per produrre report di alta qualità, affidabili e ben strutturati.
English
This paper tackles open-ended deep research (OEDR), a complex challenge where
AI agents must synthesize vast web-scale information into insightful reports.
Current approaches are plagued by dual-fold limitations: static research
pipelines that decouple planning from evidence acquisition and one-shot
generation paradigms that easily suffer from long-context failure issues like
"loss in the middle" and hallucinations. To address these challenges, we
introduce WebWeaver, a novel dual-agent framework that emulates the human
research process. The planner operates in a dynamic cycle, iteratively
interleaving evidence acquisition with outline optimization to produce a
comprehensive, source-grounded outline linking to a memory bank of evidence.
The writer then executes a hierarchical retrieval and writing process,
composing the report section by section. By performing targeted retrieval of
only the necessary evidence from the memory bank for each part, it effectively
mitigates long-context issues. Our framework establishes a new state-of-the-art
across major OEDR benchmarks, including DeepResearch Bench, DeepConsult, and
DeepResearchGym. These results validate our human-centric, iterative
methodology, demonstrating that adaptive planning and focused synthesis are
crucial for producing high-quality, reliable, and well-structured reports.