Tiefenforscher mit Testzeit-Diffusion
Deep Researcher with Test-Time Diffusion
July 21, 2025
papers.authors: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
papers.abstract
Tiefgehende Forschungsagenten, die durch Large Language Models (LLMs) angetrieben werden, schreiten rasch voran; dennoch erreicht ihre Leistung oft ein Plateau, wenn sie komplexe, langformatige Forschungsberichte mit generischen Testzeit-Skalierungsalgorithmen generieren. Inspiriert von der iterativen Natur menschlicher Forschung, die Zyklen von Suche, Schlussfolgerung und Überarbeitung umfasst, schlagen wir den Test-Time Diffusion Deep Researcher (TTD-DR) vor. Dieses neuartige Rahmenwerk konzeptualisiert die Generierung von Forschungsberichten als einen Diffusionsprozess. TTD-DR startet diesen Prozess mit einem vorläufigen Entwurf, einem aktualisierbaren Skelett, das als sich entwickelnde Grundlage dient, um die Forschungsrichtung zu leiten. Der Entwurf wird dann iterativ durch einen „Entrauschungs“-Prozess verfeinert, der dynamisch durch einen Retrieval-Mechanismus informiert wird, der in jedem Schritt externe Informationen einbezieht. Der Kernprozess wird weiter durch einen selbst-evolutionären Algorithmus verbessert, der auf jede Komponente des agentenbasierten Workflows angewendet wird und so die Generierung von hochwertigem Kontext für den Diffusionsprozess sicherstellt. Dieser entwurfszentrierte Ansatz macht den Berichtserstellungsprozess zeitnaher und kohärenter, während der Informationsverlust während des iterativen Suchprozesses reduziert wird. Wir zeigen, dass unser TTD-DR auf einer Vielzahl von Benchmarks, die intensive Suche und Multi-Hop-Schlussfolgerungen erfordern, state-of-the-art Ergebnisse erzielt und bestehende tiefgehende Forschungsagenten deutlich übertrifft.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.