Deep Researcher con Diffusione al Tempo di Test
Deep Researcher with Test-Time Diffusion
July 21, 2025
Autori: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
Abstract
Gli agenti di ricerca avanzati, potenziati da Large Language Models (LLM), stanno progredendo rapidamente; tuttavia, le loro prestazioni spesso raggiungono un plateau nella generazione di rapporti di ricerca complessi e di lunga durata utilizzando algoritmi di scalatura generici in fase di test. Traendo ispirazione dalla natura iterativa della ricerca umana, che prevede cicli di ricerca, ragionamento e revisione, proponiamo il Test-Time Diffusion Deep Researcher (TTD-DR). Questo nuovo framework concettualizza la generazione di rapporti di ricerca come un processo di diffusione. Il TTD-DR avvia questo processo con una bozza preliminare, uno scheletro aggiornabile che funge da fondamento in evoluzione per guidare la direzione della ricerca. La bozza viene poi raffinata iterativamente attraverso un processo di "denoising", che è dinamicamente informato da un meccanismo di recupero che incorpora informazioni esterne ad ogni passo. Il processo centrale è ulteriormente migliorato da un algoritmo auto-evolutivo applicato a ciascun componente del flusso di lavoro dell'agente, garantendo la generazione di contesti di alta qualità per il processo di diffusione. Questo design centrato sulla bozza rende il processo di scrittura del rapporto più tempestivo e coerente, riducendo al contempo la perdita di informazioni durante il processo di ricerca iterativo. Dimostriamo che il nostro TTD-DR raggiunge risultati all'avanguardia su un'ampia gamma di benchmark che richiedono una ricerca intensiva e un ragionamento multi-hop, superando significativamente gli esistenti agenti di ricerca avanzati.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.