Diepe Onderzoeker met Test-Tijd Diffusie
Deep Researcher with Test-Time Diffusion
July 21, 2025
Auteurs: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
Samenvatting
Diepe onderzoeksagenten, aangedreven door Large Language Models (LLMs), maken snel vooruitgang; toch stagneert hun prestaties vaak bij het genereren van complexe, langlopende onderzoeksrapporten met behulp van generieke test-time schaalalgoritmen. Geïnspireerd door de iteratieve aard van menselijk onderzoek, dat cycli van zoeken, redeneren en revisie omvat, stellen we de Test-Time Diffusion Deep Researcher (TTD-DR) voor. Dit nieuwe framework conceptualiseert het genereren van onderzoeksrapporten als een diffusieproces. TTD-DR start dit proces met een voorlopige conceptversie, een bijwerkbaar skelet dat dient als een evoluerende basis om de onderzoeksrichting te sturen. Het concept wordt vervolgens iteratief verfijnd door een "denoising"-proces, dat dynamisch wordt geïnformeerd door een retrievalsysteem dat bij elke stap externe informatie integreert. Het kernproces wordt verder versterkt door een zelf-evolutionair algoritme dat wordt toegepast op elk onderdeel van de agentworkflow, waardoor de generatie van hoogwaardige context voor het diffusieproces wordt gegarandeerd. Dit ontwerp, gericht op het concept, maakt het schrijfproces van het rapport tijdiger en coherent, terwijl informatieverlies tijdens het iteratieve zoekproces wordt verminderd. We tonen aan dat onze TTD-DR state-of-the-art resultaten behaalt op een breed scala aan benchmarks die intensief zoeken en multi-hop redeneren vereisen, en daarmee bestaande diepe onderzoeksagenten aanzienlijk overtreft.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.