WebWeaver : Structuration des preuves à l'échelle du web avec des plans dynamiques pour la recherche approfondie et ouverte
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research
September 16, 2025
papers.authors: Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, Pengjun Xie, Fei Huang, Jun Zhang, Jingren Zhou
cs.AI
papers.abstract
Cet article aborde le défi complexe de la recherche approfondie ouverte (OEDR), où des agents d'IA doivent synthétiser des informations massives à l'échelle du web en rapports approfondis. Les approches actuelles souffrent de limitations doubles : des pipelines de recherche statiques qui dissocient la planification de l'acquisition de preuves, et des paradigmes de génération en une seule étape qui sont facilement sujets à des échecs de contexte long, tels que la "perte au milieu" et les hallucinations. Pour relever ces défis, nous introduisons WebWeaver, un nouveau cadre à double agent qui imite le processus de recherche humain. Le planificateur opère dans un cycle dynamique, entrelaçant de manière itérative l'acquisition de preuves avec l'optimisation du plan pour produire un plan complet et ancré dans les sources, lié à une banque de mémoire de preuves. Le rédacteur exécute ensuite un processus hiérarchique de récupération et de rédaction, composant le rapport section par section. En effectuant une récupération ciblée des seules preuves nécessaires de la banque de mémoire pour chaque partie, il atténue efficacement les problèmes de contexte long. Notre cadre établit un nouvel état de l'art sur les principaux benchmarks OEDR, notamment DeepResearch Bench, DeepConsult et DeepResearchGym. Ces résultats valident notre méthodologie itérative centrée sur l'humain, démontrant qu'une planification adaptative et une synthèse ciblée sont cruciales pour produire des rapports de haute qualité, fiables et bien structurés.
English
This paper tackles open-ended deep research (OEDR), a complex challenge where
AI agents must synthesize vast web-scale information into insightful reports.
Current approaches are plagued by dual-fold limitations: static research
pipelines that decouple planning from evidence acquisition and one-shot
generation paradigms that easily suffer from long-context failure issues like
"loss in the middle" and hallucinations. To address these challenges, we
introduce WebWeaver, a novel dual-agent framework that emulates the human
research process. The planner operates in a dynamic cycle, iteratively
interleaving evidence acquisition with outline optimization to produce a
comprehensive, source-grounded outline linking to a memory bank of evidence.
The writer then executes a hierarchical retrieval and writing process,
composing the report section by section. By performing targeted retrieval of
only the necessary evidence from the memory bank for each part, it effectively
mitigates long-context issues. Our framework establishes a new state-of-the-art
across major OEDR benchmarks, including DeepResearch Bench, DeepConsult, and
DeepResearchGym. These results validate our human-centric, iterative
methodology, demonstrating that adaptive planning and focused synthesis are
crucial for producing high-quality, reliable, and well-structured reports.