Pesquisador Profundo com Difusão em Tempo de Teste
Deep Researcher with Test-Time Diffusion
July 21, 2025
Autores: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
Resumo
Agentes de pesquisa profunda, impulsionados por Modelos de Linguagem de Grande Escala (LLMs), estão avançando rapidamente; no entanto, seu desempenho frequentemente atinge um platô ao gerar relatórios de pesquisa complexos e de longo formato usando algoritmos de escalonamento genéricos em tempo de teste. Inspirados pela natureza iterativa da pesquisa humana, que envolve ciclos de busca, raciocínio e revisão, propomos o Test-Time Diffusion Deep Researcher (TTD-DR). Este novo framework conceitua a geração de relatórios de pesquisa como um processo de difusão. O TTD-DR inicia esse processo com um rascunho preliminar, um esqueleto atualizável que serve como base evolutiva para guiar a direção da pesquisa. O rascunho é então refinado iterativamente por meio de um processo de "desruído", que é dinamicamente informado por um mecanismo de recuperação que incorpora informações externas a cada etapa. O processo central é ainda aprimorado por um algoritmo auto-evolutivo aplicado a cada componente do fluxo de trabalho do agente, garantindo a geração de contexto de alta qualidade para o processo de difusão. Esse design centrado no rascunho torna o processo de escrita de relatórios mais oportuno e coerente, ao mesmo tempo que reduz a perda de informação durante o processo iterativo de busca. Demonstramos que nosso TTD-DR alcança resultados de ponta em uma ampla gama de benchmarks que exigem busca intensiva e raciocínio multi-hop, superando significativamente os agentes de pesquisa profunda existentes.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.