분리된 계획과 실행: 심층 탐색을 위한 계층적 추론 프레임워크
Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search
July 3, 2025
저자: Jiajie Jin, Xiaoxi Li, Guanting Dong, Yuyao Zhang, Yutao Zhu, Yang Zhao, Hongjin Qian, Zhicheng Dou
cs.AI
초록
실제 검색 시나리오에서의 복잡한 정보 요구는 다양한 소스에 걸친 심층적인 추론과 지식 통합을 요구하며, 이는 기존의 검색 증강 생성(RAG) 파이프라인이 효과적으로 해결하기 어려운 문제입니다. 현재의 추론 기반 접근법은 근본적인 한계를 가지고 있습니다: 단일 모델을 사용하여 상위 수준의 계획과 세부 실행을 모두 처리함으로써 비효율적인 추론과 제한된 확장성을 초래합니다. 본 논문에서는 전략적 계획과 전문적 실행을 분리하는 계층적 프레임워크인 HiRA를 소개합니다. 우리의 접근법은 복잡한 검색 작업을 집중적인 하위 작업으로 분해하고, 각 하위 작업을 외부 도구와 추론 능력을 갖춘 도메인 특화 에이전트에 할당하며, 구조화된 통합 메커니즘을 통해 결과를 조정합니다. 이러한 분리는 실행 세부 사항이 상위 수준의 추론을 방해하지 않도록 하면서도 다양한 유형의 정보 처리에 특화된 전문 지식을 활용할 수 있게 합니다. 네 가지 복잡한 크로스 모달 심층 검색 벤치마크에서의 실험은 HiRA가 최신 RAG 및 에이전트 기반 시스템을 크게 능가함을 보여줍니다. 우리의 결과는 다단계 정보 탐색 작업에서 계획과 실행을 분리하는 것이 답변 품질과 시스템 효율성 모두에서 개선을 가져온다는 것을 입증합니다. 우리의 코드는 https://github.com/ignorejjj/HiRA에서 확인할 수 있습니다.
English
Complex information needs in real-world search scenarios demand deep
reasoning and knowledge synthesis across diverse sources, which traditional
retrieval-augmented generation (RAG) pipelines struggle to address effectively.
Current reasoning-based approaches suffer from a fundamental limitation: they
use a single model to handle both high-level planning and detailed execution,
leading to inefficient reasoning and limited scalability. In this paper, we
introduce HiRA, a hierarchical framework that separates strategic planning from
specialized execution. Our approach decomposes complex search tasks into
focused subtasks, assigns each subtask to domain-specific agents equipped with
external tools and reasoning capabilities, and coordinates the results through
a structured integration mechanism. This separation prevents execution details
from disrupting high-level reasoning while enabling the system to leverage
specialized expertise for different types of information processing.
Experiments on four complex, cross-modal deep search benchmarks demonstrate
that HiRA significantly outperforms state-of-the-art RAG and agent-based
systems. Our results show improvements in both answer quality and system
efficiency, highlighting the effectiveness of decoupled planning and execution
for multi-step information seeking tasks. Our code is available at
https://github.com/ignorejjj/HiRA.