Investigador Profundo con Difusión en Tiempo de Prueba
Deep Researcher with Test-Time Diffusion
July 21, 2025
Autores: Rujun Han, Yanfei Chen, Zoey CuiZhu, Lesly Miculicich, Guan Sun, Yuanjun Bi, Weiming Wen, Hui Wan, Chunfeng Wen, Solène Maître, George Lee, Vishy Tirumalashetty, Emily Xue, Zizhao Zhang, Salem Haykal, Burak Gokturk, Tomas Pfister, Chen-Yu Lee
cs.AI
Resumen
Los agentes de investigación profunda, impulsados por modelos de lenguaje de gran escala (LLMs), están avanzando rápidamente; sin embargo, su rendimiento a menudo se estanca al generar informes de investigación complejos y extensos utilizando algoritmos genéricos de escalamiento en tiempo de prueba. Inspirándonos en la naturaleza iterativa de la investigación humana, que involucra ciclos de búsqueda, razonamiento y revisión, proponemos el Investigador Profundo de Difusión en Tiempo de Prueba (TTD-DR, por sus siglas en inglés). Este novedoso marco conceptualiza la generación de informes de investigación como un proceso de difusión. El TTD-DR inicia este proceso con un borrador preliminar, un esqueleto actualizable que sirve como base evolutiva para guiar la dirección de la investigación. Este borrador se refina iterativamente mediante un proceso de "eliminación de ruido", que se informa dinámicamente por un mecanismo de recuperación que incorpora información externa en cada paso. El proceso central se ve aún más potenciado por un algoritmo de auto-evolución aplicado a cada componente del flujo de trabajo del agente, asegurando la generación de contexto de alta calidad para el proceso de difusión. Este diseño centrado en el borrador hace que el proceso de redacción de informes sea más oportuno y coherente, al tiempo que reduce la pérdida de información durante el proceso de búsqueda iterativo. Demostramos que nuestro TTD-DR logra resultados de vanguardia en una amplia gama de benchmarks que requieren búsqueda intensiva y razonamiento multi-hop, superando significativamente a los agentes de investigación profunda existentes.
English
Deep research agents, powered by Large Language Models (LLMs), are rapidly
advancing; yet, their performance often plateaus when generating complex,
long-form research reports using generic test-time scaling algorithms. Drawing
inspiration from the iterative nature of human research, which involves cycles
of searching, reasoning, and revision, we propose the Test-Time Diffusion Deep
Researcher (TTD-DR). This novel framework conceptualizes research report
generation as a diffusion process. TTD-DR initiates this process with a
preliminary draft, an updatable skeleton that serves as an evolving foundation
to guide the research direction. The draft is then iteratively refined through
a "denoising" process, which is dynamically informed by a retrieval mechanism
that incorporates external information at each step. The core process is
further enhanced by a self-evolutionary algorithm applied to each component of
the agentic workflow, ensuring the generation of high-quality context for the
diffusion process. This draft-centric design makes the report writing process
more timely and coherent while reducing information loss during the iterative
search process. We demonstrate that our TTD-DR achieves state-of-the-art
results on a wide array of benchmarks that require intensive search and
multi-hop reasoning, significantly outperforming existing deep research agents.