Разделение планирования и выполнения: Иерархическая структура рассуждений для глубокого поиска
Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search
July 3, 2025
Авторы: Jiajie Jin, Xiaoxi Li, Guanting Dong, Yuyao Zhang, Yutao Zhu, Yang Zhao, Hongjin Qian, Zhicheng Dou
cs.AI
Аннотация
Сложные информационные потребности в реальных сценариях поиска требуют глубокого анализа и синтеза знаний из разнообразных источников, с чем традиционные конвейеры генерации с использованием поиска (RAG) справляются недостаточно эффективно. Современные подходы, основанные на рассуждениях, сталкиваются с фундаментальным ограничением: они используют одну модель как для высокоуровневого планирования, так и для детального выполнения, что приводит к неэффективному рассуждению и ограниченной масштабируемости. В данной работе мы представляем HiRA — иерархическую структуру, которая разделяет стратегическое планирование и специализированное выполнение. Наш подход разбивает сложные поисковые задачи на узконаправленные подзадачи, назначает каждую подзадачу специализированным агентам, оснащенным внешними инструментами и возможностями для рассуждений, и координирует результаты через структурированный механизм интеграции. Такое разделение предотвращает влияние деталей выполнения на высокоуровневое рассуждение, одновременно позволяя системе использовать специализированные знания для различных типов обработки информации. Эксперименты на четырех сложных кросс-модальных бенчмарках для глубокого поиска демонстрируют, что HiRA значительно превосходит современные системы на основе RAG и агентов. Наши результаты показывают улучшения как в качестве ответов, так и в эффективности системы, подчеркивая эффективность разделенного планирования и выполнения для многошаговых задач поиска информации. Наш код доступен по адресу https://github.com/ignorejjj/HiRA.
English
Complex information needs in real-world search scenarios demand deep
reasoning and knowledge synthesis across diverse sources, which traditional
retrieval-augmented generation (RAG) pipelines struggle to address effectively.
Current reasoning-based approaches suffer from a fundamental limitation: they
use a single model to handle both high-level planning and detailed execution,
leading to inefficient reasoning and limited scalability. In this paper, we
introduce HiRA, a hierarchical framework that separates strategic planning from
specialized execution. Our approach decomposes complex search tasks into
focused subtasks, assigns each subtask to domain-specific agents equipped with
external tools and reasoning capabilities, and coordinates the results through
a structured integration mechanism. This separation prevents execution details
from disrupting high-level reasoning while enabling the system to leverage
specialized expertise for different types of information processing.
Experiments on four complex, cross-modal deep search benchmarks demonstrate
that HiRA significantly outperforms state-of-the-art RAG and agent-based
systems. Our results show improvements in both answer quality and system
efficiency, highlighting the effectiveness of decoupled planning and execution
for multi-step information seeking tasks. Our code is available at
https://github.com/ignorejjj/HiRA.