ChatPaper.aiChatPaper

Investigación Profunda: Un Estudio Sistemático

Deep Research: A Systematic Survey

November 24, 2025
Autores: Zhengliang Shi, Yiqun Chen, Haitao Li, Weiwei Sun, Shiyu Ni, Yougang Lyu, Run-Ze Fan, Bowen Jin, Yixuan Weng, Minjun Zhu, Qiujie Xie, Xinyu Guo, Qu Yang, Jiayi Wu, Jujia Zhao, Xiaqiang Tang, Xinbei Ma, Cunxiang Wang, Jiaxin Mao, Qingyao Ai, Jen-Tse Huang, Wenxuan Wang, Yue Zhang, Yiming Yang, Zhaopeng Tu, Zhaochun Ren
cs.AI

Resumen

Los modelos de lenguaje grandes (LLM) han evolucionado rápidamente de generadores de texto a potentes solucionadores de problemas. Sin embargo, muchas tareas abiertas exigen pensamiento crítico, integración de múltiples fuentes y resultados verificables, lo cual va más allá del prompting de una sola vez o de la generación aumentada por recuperación estándar. Recientemente, numerosos estudios han explorado la Investigación Profunda (Deep Research, DR), que pretende combinar las capacidades de razonamiento de los LLM con herramientas externas, como motores de búsqueda, capacitando así a los LLM para actuar como agentes de investigación capaces de completar tareas complejas y de final abierto. Esta encuesta presenta una visión general exhaustiva y sistemática de los sistemas de investigación profunda, incluyendo una hoja de ruta clara, componentes fundamentales, técnicas de implementación práctica, desafíos importantes y direcciones futuras. Específicamente, nuestras principales contribuciones son las siguientes: (i) formalizamos una hoja de ruta de tres etapas y distinguimos la investigación profunda de paradigmas relacionados; (ii) presentamos cuatro componentes clave: planificación de consultas, adquisición de información, gestión de la memoria y generación de respuestas, cada uno acompañado de sub-taxonomías de grano fino; (iii) resumimos técnicas de optimización, incluyendo prompting, ajuste fino supervisado y aprendizaje por refuerzo agentico; y (iv) consolidamos criterios de evaluación y desafíos abiertos, con el objetivo de guiar y facilitar el desarrollo futuro. Dado que el campo de la investigación profunda continúa evolucionando rápidamente, nos comprometemos a actualizar continuamente esta encuesta para reflejar los últimos progresos en esta área.
English
Large language models (LLMs) have rapidly evolved from text generators into powerful problem solvers. Yet, many open tasks demand critical thinking, multi-source, and verifiable outputs, which are beyond single-shot prompting or standard retrieval-augmented generation. Recently, numerous studies have explored Deep Research (DR), which aims to combine the reasoning capabilities of LLMs with external tools, such as search engines, thereby empowering LLMs to act as research agents capable of completing complex, open-ended tasks. This survey presents a comprehensive and systematic overview of deep research systems, including a clear roadmap, foundational components, practical implementation techniques, important challenges, and future directions. Specifically, our main contributions are as follows: (i) we formalize a three-stage roadmap and distinguish deep research from related paradigms; (ii) we introduce four key components: query planning, information acquisition, memory management, and answer generation, each paired with fine-grained sub-taxonomies; (iii) we summarize optimization techniques, including prompting, supervised fine-tuning, and agentic reinforcement learning; and (iv) we consolidate evaluation criteria and open challenges, aiming to guide and facilitate future development. As the field of deep research continues to evolve rapidly, we are committed to continuously updating this survey to reflect the latest progress in this area.
PDF92December 4, 2025