ChatPaper.aiChatPaper

WebWeaver: Strukturierung von Web-Skalen-Evidenz mit dynamischen Gliederungen für offene, tiefgehende Forschung

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

September 16, 2025
papers.authors: Zijian Li, Xin Guan, Bo Zhang, Shen Huang, Houquan Zhou, Shaopeng Lai, Ming Yan, Yong Jiang, Pengjun Xie, Fei Huang, Jun Zhang, Jingren Zhou
cs.AI

papers.abstract

Dieses Papier befasst sich mit Open-Ended Deep Research (OEDR), einer komplexen Herausforderung, bei der KI-Agenten umfangreiche, webweite Informationen in aussagekräftige Berichte synthetisieren müssen. Aktuelle Ansätze leiden unter zweifachen Einschränkungen: statische Forschungspipelines, die die Planung vom Erwerb von Beweisen entkoppeln, und Einmal-Generierungsparadigmen, die leicht unter Langkontext-Problemen wie „Verlust in der Mitte“ und Halluzinationen leiden. Um diese Herausforderungen zu bewältigen, stellen wir WebWeaver vor, ein neuartiges Dual-Agenten-Framework, das den menschlichen Forschungsprozess nachahmt. Der Planer arbeitet in einem dynamischen Zyklus, bei dem der Erwerb von Beweisen iterativ mit der Optimierung des Gliederungsentwurfs verknüpft wird, um eine umfassende, quellengestützte Gliederung zu erstellen, die mit einer Speicherbank von Beweisen verknüpft ist. Der Schreiber führt dann einen hierarchischen Abruf- und Schreibprozess durch und verfasst den Bericht abschnittsweise. Durch den gezielten Abruf nur der notwendigen Beweise aus der Speicherbank für jeden Teil werden Langkontext-Probleme effektiv gemildert. Unser Framework setzt einen neuen Maßstab auf wichtigen OEDR-Benchmarks, darunter DeepResearch Bench, DeepConsult und DeepResearchGym. Diese Ergebnisse bestätigen unsere menschenzentrierte, iterative Methodik und zeigen, dass adaptive Planung und fokussierte Synthese entscheidend sind, um hochwertige, zuverlässige und gut strukturierte Berichte zu erstellen.
English
This paper tackles open-ended deep research (OEDR), a complex challenge where AI agents must synthesize vast web-scale information into insightful reports. Current approaches are plagued by dual-fold limitations: static research pipelines that decouple planning from evidence acquisition and one-shot generation paradigms that easily suffer from long-context failure issues like "loss in the middle" and hallucinations. To address these challenges, we introduce WebWeaver, a novel dual-agent framework that emulates the human research process. The planner operates in a dynamic cycle, iteratively interleaving evidence acquisition with outline optimization to produce a comprehensive, source-grounded outline linking to a memory bank of evidence. The writer then executes a hierarchical retrieval and writing process, composing the report section by section. By performing targeted retrieval of only the necessary evidence from the memory bank for each part, it effectively mitigates long-context issues. Our framework establishes a new state-of-the-art across major OEDR benchmarks, including DeepResearch Bench, DeepConsult, and DeepResearchGym. These results validate our human-centric, iterative methodology, demonstrating that adaptive planning and focused synthesis are crucial for producing high-quality, reliable, and well-structured reports.
PDF773September 17, 2025