Pesquisador Profundo com Difusão em Tempo de Teste

Resumo

Agentes de pesquisa profunda, impulsionados por Modelos de Linguagem de Grande Escala (LLMs), estão avançando rapidamente; no entanto, seu desempenho frequentemente atinge um platô ao gerar relatórios de pesquisa complexos e de longo formato usando algoritmos de escalonamento genéricos em tempo de teste. Inspirados pela natureza iterativa da pesquisa humana, que envolve ciclos de busca, raciocínio e revisão, propomos o Test-Time Diffusion Deep Researcher (TTD-DR). Este novo framework conceitua a geração de relatórios de pesquisa como um processo de difusão. O TTD-DR inicia esse processo com um rascunho preliminar, um esqueleto atualizável que serve como base evolutiva para guiar a direção da pesquisa. O rascunho é então refinado iterativamente por meio de um processo de "desruído", que é dinamicamente informado por um mecanismo de recuperação que incorpora informações externas a cada etapa. O processo central é ainda aprimorado por um algoritmo auto-evolutivo aplicado a cada componente do fluxo de trabalho do agente, garantindo a geração de contexto de alta qualidade para o processo de difusão. Esse design centrado no rascunho torna o processo de escrita de relatórios mais oportuno e coerente, ao mesmo tempo que reduz a perda de informação durante o processo iterativo de busca. Demonstramos que nosso TTD-DR alcança resultados de ponta em uma ampla gama de benchmarks que exigem busca intensiva e raciocínio multi-hop, superando significativamente os agentes de pesquisa profunda existentes.

English

Deep research agents, powered by Large Language Models (LLMs), are rapidly advancing; yet, their performance often plateaus when generating complex, long-form research reports using generic test-time scaling algorithms. Drawing inspiration from the iterative nature of human research, which involves cycles of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep Researcher (TTD-DR). This novel framework conceptualizes research report generation as a diffusion process. TTD-DR initiates this process with a preliminary draft, an updatable skeleton that serves as an evolving foundation to guide the research direction. The draft is then iteratively refined through a "denoising" process, which is dynamically informed by a retrieval mechanism that incorporates external information at each step. The core process is further enhanced by a self-evolutionary algorithm applied to each component of the agentic workflow, ensuring the generation of high-quality context for the diffusion process. This draft-centric design makes the report writing process more timely and coherent while reducing information loss during the iterative search process. We demonstrate that our TTD-DR achieves state-of-the-art results on a wide array of benchmarks that require intensive search and multi-hop reasoning, significantly outperforming existing deep research agents.

Pesquisador Profundo com Difusão em Tempo de Teste

Deep Researcher with Test-Time Diffusion

Resumo

Support