Tiefensuche mit hierarchischer metakognitiver Überwachung inspiriert durch die kognitive Neurowissenschaft
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
January 30, 2026
papers.authors: Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu, Jun Xu
cs.AI
papers.abstract
Tiefe Suchagenten, die auf großen Sprachmodellen basieren, haben beeindruckende Fähigkeiten bei der mehrstufigen Recherche, dem logischen Schlussfolgern und der Ausführung langfristiger Aufgaben gezeigt. Ihre praktischen Fehlschläge sind jedoch oft auf das Fehlen von Mechanismen zurückzuführen, die Denk- und Retrieval-Zustände überwachen und regulieren, während sich Aufgaben unter Unsicherheit entwickeln. Erkenntnisse aus der kognitiven Neurowissenschaft legen nahe, dass menschliche Metakognition hierarchisch organisiert ist und schnelle Anomalieerkennung mit selektiv ausgelöster, erfahrungsgesteuerter Reflexion integriert. In dieser Arbeit schlagen wir *Deep Search with Meta-Cognitive Monitoring* (DS-MCM) vor, ein Deep-Search-Framework, das um einen expliziten hierarchischen Metakognitions-Überwachungsmechanismus erweitert ist. DS-MCM integriert einen *Fast Consistency Monitor*, der leichtgewichtige Prüfungen der Übereinstimmung zwischen externen Evidenzen und internem Schlussfolgerungsvertrauen durchführt, sowie einen *Slow Experience-Driven Monitor*, der selektiv aktiviert wird, um korrigierende Eingriffe auf Basis von Erfahrungswissen aus historischen Agenten-Trajektorien zu steuern. Durch die direkte Einbettung der Überwachung in den Schlussfolgerungs-Retrieval-Zyklus bestimmt DS-MCM sowohl, wann ein Eingriff gerechtfertigt ist, als auch, wie Korrekturmaßnahmen durch frühere Erfahrungen informiert werden sollten. Experimente über mehrere Deep-Search-Benchmarks und Basis-Modelle hinweg zeigen, dass DS-MCM die Leistung und Robustheit konsistent verbessert.
English
Deep search agents powered by large language models have demonstrated strong capabilities in multi-step retrieval, reasoning, and long-horizon task execution. However, their practical failures often stem from the lack of mechanisms to monitor and regulate reasoning and retrieval states as tasks evolve under uncertainty. Insights from cognitive neuroscience suggest that human metacognition is hierarchically organized, integrating fast anomaly detection with selectively triggered, experience-driven reflection. In this work, we propose Deep Search with Meta-Cognitive Monitoring (DS-MCM), a deep search framework augmented with an explicit hierarchical metacognitive monitoring mechanism. DS-MCM integrates a Fast Consistency Monitor, which performs lightweight checks on the alignment between external evidence and internal reasoning confidence, and a Slow Experience-Driven Monitor, which is selectively activated to guide corrective intervention based on experience memory from historical agent trajectories. By embedding monitoring directly into the reasoning-retrieval loop, DS-MCM determines both when intervention is warranted and how corrective actions should be informed by prior experience. Experiments across multiple deep search benchmarks and backbone models demonstrate that DS-MCM consistently improves performance and robustness.