Глубокое исследование: систематический обзор
Deep Research: A Systematic Survey
November 24, 2025
Авторы: Zhengliang Shi, Yiqun Chen, Haitao Li, Weiwei Sun, Shiyu Ni, Yougang Lyu, Run-Ze Fan, Bowen Jin, Yixuan Weng, Minjun Zhu, Qiujie Xie, Xinyu Guo, Qu Yang, Jiayi Wu, Jujia Zhao, Xiaqiang Tang, Xinbei Ma, Cunxiang Wang, Jiaxin Mao, Qingyao Ai, Jen-Tse Huang, Wenxuan Wang, Yue Zhang, Yiming Yang, Zhaopeng Tu, Zhaochun Ren
cs.AI
Аннотация
Крупные языковые модели (LLM) стремительно эволюционировали от генераторов текста к мощным инструментам решения задач. Однако многие открытые задачи требуют критического мышления, использования множества источников и проверяемых результатов, что выходит за рамки одношаговых промптов или стандартного поискового усиления генерации. В последнее время многочисленные исследования исследуют Глубокое Исследование (Deep Research, DR), целью которого является объединение способностей LLM к рассуждению с внешними инструментами, такими как поисковые системы, что позволяет LLM действовать в качестве исследовательских агентов, способных выполнять сложные, открытые задачи. Данный обзор представляет всесторонний и систематический обзор систем глубокого исследования, включая четкую дорожную карту, базовые компоненты, практические методы реализации, важные проблемы и будущие направления. В частности, наши основные вклады заключаются в следующем: (i) мы формализуем трехэтапную дорожную карту и отличаем глубокое исследование от смежных парадигм; (ii) мы представляем четыре ключевых компонента: планирование запросов, получение информации, управление памятью и генерация ответов, каждый из которых сопровождается детализированной субтаксономией; (iii) мы суммируем методы оптимизации, включая промптинг, контролируемое тонкое обучение и агентное обучение с подкреплением; и (iv) мы консолидируем критерии оценки и открытые проблемы, стремясь направлять и способствовать будущему развитию. Поскольку область глубокого исследования продолжает быстро развиваться, мы обязуемся постоянно обновлять этот обзор, чтобы отражать последние достижения в данной области.
English
Large language models (LLMs) have rapidly evolved from text generators into powerful problem solvers. Yet, many open tasks demand critical thinking, multi-source, and verifiable outputs, which are beyond single-shot prompting or standard retrieval-augmented generation. Recently, numerous studies have explored Deep Research (DR), which aims to combine the reasoning capabilities of LLMs with external tools, such as search engines, thereby empowering LLMs to act as research agents capable of completing complex, open-ended tasks. This survey presents a comprehensive and systematic overview of deep research systems, including a clear roadmap, foundational components, practical implementation techniques, important challenges, and future directions. Specifically, our main contributions are as follows: (i) we formalize a three-stage roadmap and distinguish deep research from related paradigms; (ii) we introduce four key components: query planning, information acquisition, memory management, and answer generation, each paired with fine-grained sub-taxonomies; (iii) we summarize optimization techniques, including prompting, supervised fine-tuning, and agentic reinforcement learning; and (iv) we consolidate evaluation criteria and open challenges, aiming to guide and facilitate future development. As the field of deep research continues to evolve rapidly, we are committed to continuously updating this survey to reflect the latest progress in this area.