Chercheur approfondi avec diffusion au moment du test
Deep Researcher with Test-Time Diffusion
July 21, 2025
papers.authors: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
papers.abstract
Les agents de recherche approfondie, alimentés par des modèles de langage à grande échelle (LLMs), progressent rapidement ; cependant, leurs performances plafonnent souvent lors de la génération de rapports de recherche complexes et détaillés en utilisant des algorithmes de mise à l'échelle génériques au moment du test. S'inspirant de la nature itérative de la recherche humaine, qui implique des cycles de recherche, de raisonnement et de révision, nous proposons le Test-Time Diffusion Deep Researcher (TTD-DR). Ce cadre novateur conceptualise la génération de rapports de recherche comme un processus de diffusion. Le TTD-DR initie ce processus avec un brouillon préliminaire, une structure modifiable qui sert de fondation évolutive pour guider la direction de la recherche. Ce brouillon est ensuite affiné de manière itérative à travers un processus de "débruitage", dynamiquement informé par un mécanisme de récupération qui intègre des informations externes à chaque étape. Le processus central est en outre amélioré par un algorithme d'auto-évolution appliqué à chaque composant du flux de travail agentique, garantissant la génération d'un contexte de haute qualité pour le processus de diffusion. Cette conception centrée sur le brouillon rend le processus de rédaction de rapports plus opportun et cohérent, tout en réduisant la perte d'information lors du processus de recherche itératif. Nous démontrons que notre TTD-DR obtient des résultats de pointe sur une large gamme de benchmarks nécessitant une recherche intensive et un raisonnement multi-saut, surpassant significativement les agents de recherche approfondie existants.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.