WebWeaver: Estructuración de Evidencia a Escala Web con Esquemas Dinámicos para Investigación Profunda de Temas Abiertos
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research
September 16, 2025
Autores: Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, Pengjun Xie, Fei Huang, Jun Zhang, Jingren Zhou
cs.AI
Resumen
Este artículo aborda la investigación profunda de final abierto (OEDR, por sus siglas en inglés), un desafío complejo en el que los agentes de IA deben sintetizar información a gran escala de la web en informes perspicaces. Los enfoques actuales están plagados de limitaciones duales: pipelines de investigación estáticos que desacoplan la planificación de la adquisición de evidencia y paradigmas de generación en una sola pasada que sufren fácilmente problemas de fallos en contextos largos, como la "pérdida en el medio" y las alucinaciones. Para abordar estos desafíos, presentamos WebWeaver, un marco de trabajo de doble agente que emula el proceso de investigación humano. El planificador opera en un ciclo dinámico, intercalando iterativamente la adquisición de evidencia con la optimización del esquema para producir un esquema completo y fundamentado en fuentes, vinculado a un banco de memoria de evidencia. El escritor luego ejecuta un proceso jerárquico de recuperación y redacción, componiendo el informe sección por sección. Al realizar una recuperación dirigida de solo la evidencia necesaria del banco de memoria para cada parte, mitiga eficazmente los problemas de contexto largo. Nuestro marco establece un nuevo estado del arte en los principales puntos de referencia de OEDR, incluyendo DeepResearch Bench, DeepConsult y DeepResearchGym. Estos resultados validan nuestra metodología iterativa y centrada en el ser humano, demostrando que la planificación adaptativa y la síntesis enfocada son cruciales para producir informes de alta calidad, confiables y bien estructurados.
English
This paper tackles open-ended deep research (OEDR), a complex challenge where
AI agents must synthesize vast web-scale information into insightful reports.
Current approaches are plagued by dual-fold limitations: static research
pipelines that decouple planning from evidence acquisition and one-shot
generation paradigms that easily suffer from long-context failure issues like
"loss in the middle" and hallucinations. To address these challenges, we
introduce WebWeaver, a novel dual-agent framework that emulates the human
research process. The planner operates in a dynamic cycle, iteratively
interleaving evidence acquisition with outline optimization to produce a
comprehensive, source-grounded outline linking to a memory bank of evidence.
The writer then executes a hierarchical retrieval and writing process,
composing the report section by section. By performing targeted retrieval of
only the necessary evidence from the memory bank for each part, it effectively
mitigates long-context issues. Our framework establishes a new state-of-the-art
across major OEDR benchmarks, including DeepResearch Bench, DeepConsult, and
DeepResearchGym. These results validate our human-centric, iterative
methodology, demonstrating that adaptive planning and focused synthesis are
crucial for producing high-quality, reliable, and well-structured reports.