Planejamento e Execução Desacoplados: Um Framework Hierárquico de Raciocínio para Busca Profunda
Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search
July 3, 2025
Autores: Jiajie Jin, Xiaoxi Li, Guanting Dong, Yuyao Zhang, Yutao Zhu, Yang Zhao, Hongjin Qian, Zhicheng Dou
cs.AI
Resumo
As necessidades complexas de informação em cenários reais de busca exigem raciocínio profundo e síntese de conhecimento a partir de diversas fontes, o que os pipelines tradicionais de geração aumentada por recuperação (RAG) têm dificuldade em abordar de forma eficaz. As abordagens baseadas em raciocínio atuais sofrem de uma limitação fundamental: elas utilizam um único modelo para lidar tanto com o planejamento de alto nível quanto com a execução detalhada, resultando em raciocínio ineficiente e escalabilidade limitada. Neste artigo, apresentamos o HiRA, uma estrutura hierárquica que separa o planejamento estratégico da execução especializada. Nossa abordagem decompõe tarefas complexas de busca em subtarefas focadas, atribui cada subtarefa a agentes específicos de domínio equipados com ferramentas externas e capacidades de raciocínio, e coordena os resultados por meio de um mecanismo estruturado de integração. Essa separação evita que detalhes de execução interrompam o raciocínio de alto nível, ao mesmo tempo em que permite que o sistema aproveite expertise especializada para diferentes tipos de processamento de informação. Experimentos em quatro benchmarks complexos de busca profunda multimodal demonstram que o HiRA supera significativamente os sistemas RAG e baseados em agentes de última geração. Nossos resultados mostram melhorias tanto na qualidade das respostas quanto na eficiência do sistema, destacando a eficácia do planejamento e execução desacoplados para tarefas de busca de informação em múltiplos passos. Nosso código está disponível em https://github.com/ignorejjj/HiRA.
English
Complex information needs in real-world search scenarios demand deep
reasoning and knowledge synthesis across diverse sources, which traditional
retrieval-augmented generation (RAG) pipelines struggle to address effectively.
Current reasoning-based approaches suffer from a fundamental limitation: they
use a single model to handle both high-level planning and detailed execution,
leading to inefficient reasoning and limited scalability. In this paper, we
introduce HiRA, a hierarchical framework that separates strategic planning from
specialized execution. Our approach decomposes complex search tasks into
focused subtasks, assigns each subtask to domain-specific agents equipped with
external tools and reasoning capabilities, and coordinates the results through
a structured integration mechanism. This separation prevents execution details
from disrupting high-level reasoning while enabling the system to leverage
specialized expertise for different types of information processing.
Experiments on four complex, cross-modal deep search benchmarks demonstrate
that HiRA significantly outperforms state-of-the-art RAG and agent-based
systems. Our results show improvements in both answer quality and system
efficiency, highlighting the effectiveness of decoupled planning and execution
for multi-step information seeking tasks. Our code is available at
https://github.com/ignorejjj/HiRA.