Recherche Approfondie avec Surveillance Méta-Cognitive Hiérarchique Inspirée par les Neurosciences Cognitives
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
January 30, 2026
papers.authors: Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu, Jun Xu
cs.AI
papers.abstract
Les agents de recherche approfondie alimentés par de grands modèles de langage ont démontré de solides capacités en matière de récupération multi-étapes, de raisonnement et d'exécution de tâches à long terme. Cependant, leurs échecs pratiques proviennent souvent de l'absence de mécanismes pour surveiller et réguler les états de raisonnement et de récupération à mesure que les tâches évoluent dans l'incertitude. Les enseignements des neurosciences cognitives suggèrent que la métacognition humaine est organisée hiérarchiquement, intégrant une détection rapide des anomalies avec une réflexion déclenchée sélectivement et guidée par l'expérience. Dans ce travail, nous proposons la Recherche Approfondie avec Surveillance Métacognitive (DS-MCM), un cadre de recherche approfondie augmenté d'un mécanisme explicite et hiérarchique de surveillance métacognitive. DS-MCM intègre un Moniteur de Cohérence Rapide, qui effectue des vérifications légères de l'alignement entre les preuves externes et la confiance interne du raisonnement, et un Moniteur Lent Guidé par l'Expérience, qui est activé sélectivement pour guider une intervention corrective basée sur la mémoire d'expérience issue des trajectoires historiques de l'agent. En intégrant la surveillance directement dans la boucle de raisonnement-récupération, DS-MCM détermine à la fois quand une intervention est justifiée et comment les actions correctives doivent être éclairées par l'expérience antérieure. Les expériences menées sur plusieurs benchmarks de recherche approfondie et modèles de base démontrent que DS-MCM améliore constamment les performances et la robustesse.
English
Deep search agents powered by large language models have demonstrated strong capabilities in multi-step retrieval, reasoning, and long-horizon task execution. However, their practical failures often stem from the lack of mechanisms to monitor and regulate reasoning and retrieval states as tasks evolve under uncertainty. Insights from cognitive neuroscience suggest that human metacognition is hierarchically organized, integrating fast anomaly detection with selectively triggered, experience-driven reflection. In this work, we propose Deep Search with Meta-Cognitive Monitoring (DS-MCM), a deep search framework augmented with an explicit hierarchical metacognitive monitoring mechanism. DS-MCM integrates a Fast Consistency Monitor, which performs lightweight checks on the alignment between external evidence and internal reasoning confidence, and a Slow Experience-Driven Monitor, which is selectively activated to guide corrective intervention based on experience memory from historical agent trajectories. By embedding monitoring directly into the reasoning-retrieval loop, DS-MCM determines both when intervention is warranted and how corrective actions should be informed by prior experience. Experiments across multiple deep search benchmarks and backbone models demonstrate that DS-MCM consistently improves performance and robustness.