ChatPaper.aiChatPaper

Planification et Exécution Découplées : Un Cadre de Raisonnement Hiérarchique pour la Recherche Profonde

Decoupled Planning and Execution: A Hierarchical Reasoning Framework for Deep Search

July 3, 2025
Auteurs: Jiajie Jin, Xiaoxi Li, Guanting Dong, Yuyao Zhang, Yutao Zhu, Yang Zhao, Hongjin Qian, Zhicheng Dou
cs.AI

Résumé

Les besoins complexes en matière d'information dans les scénarios de recherche réels exigent un raisonnement approfondi et une synthèse des connaissances à partir de sources diverses, ce que les pipelines traditionnels de génération augmentée par récupération (RAG) peinent à traiter efficacement. Les approches actuelles basées sur le raisonnement souffrent d'une limitation fondamentale : elles utilisent un seul modèle pour gérer à la fois la planification de haut niveau et l'exécution détaillée, ce qui entraîne un raisonnement inefficace et une scalabilité limitée. Dans cet article, nous présentons HiRA, un cadre hiérarchique qui sépare la planification stratégique de l'exécution spécialisée. Notre approche décompose les tâches de recherche complexes en sous-tâches ciblées, attribue chaque sous-tâche à des agents spécialisés dotés d'outils externes et de capacités de raisonnement, et coordonne les résultats grâce à un mécanisme d'intégration structuré. Cette séparation empêche les détails d'exécution de perturber le raisonnement de haut niveau tout en permettant au système de tirer parti d'une expertise spécialisée pour différents types de traitement de l'information. Les expériences menées sur quatre benchmarks complexes de recherche approfondie intermodale démontrent que HiRA surpasse significativement les systèmes RAG et basés sur des agents de pointe. Nos résultats montrent des améliorations à la fois en termes de qualité des réponses et d'efficacité du système, mettant en évidence l'efficacité d'une planification et d'une exécution découplées pour les tâches de recherche d'information en plusieurs étapes. Notre code est disponible à l'adresse https://github.com/ignorejjj/HiRA.
English
Complex information needs in real-world search scenarios demand deep reasoning and knowledge synthesis across diverse sources, which traditional retrieval-augmented generation (RAG) pipelines struggle to address effectively. Current reasoning-based approaches suffer from a fundamental limitation: they use a single model to handle both high-level planning and detailed execution, leading to inefficient reasoning and limited scalability. In this paper, we introduce HiRA, a hierarchical framework that separates strategic planning from specialized execution. Our approach decomposes complex search tasks into focused subtasks, assigns each subtask to domain-specific agents equipped with external tools and reasoning capabilities, and coordinates the results through a structured integration mechanism. This separation prevents execution details from disrupting high-level reasoning while enabling the system to leverage specialized expertise for different types of information processing. Experiments on four complex, cross-modal deep search benchmarks demonstrate that HiRA significantly outperforms state-of-the-art RAG and agent-based systems. Our results show improvements in both answer quality and system efficiency, highlighting the effectiveness of decoupled planning and execution for multi-step information seeking tasks. Our code is available at https://github.com/ignorejjj/HiRA.
PDF121July 4, 2025