인지 신경과학에서 영감을 받은 계층적 메타인지 모니터링 기반 딥 서치
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
January 30, 2026
저자: Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu, Jun Xu
cs.AI
초록
대규모 언어 모델로 구동되는 딥 검색 에이전트는 다단계 정보 검색, 추론, 장기 과제 수행에서 강력한 능력을 입증해왔습니다. 그러나 실제 운영에서의 실패는 주로 불확실성 하에 과제가 진행됨에 따라 추론 및 검색 상태를 모니터링하고 조절할 메커니즘이 부족하기 때문에 발생합니다. 인지 신경과학의 통찰에 따르면, 인간의 메타인지는 계층적으로 조직되어 빠른 이상 감지와 선택적으로 촉발되는 경험 기반 성찰을 통합합니다. 본 연구에서는 명시적인 계층적 메타인지 모니터링 메커니즘을 강화한 딥 검색 프레임워크인 DS-MCM(메타인지 모니터링을 통한 딥 검색)을 제안합니다. DS-MCM은 외부 증거와 내부 추론 신뢰도 간의 일치성을 경량 점검하는 '빠른 일관성 모니터'와 역사적 에이전트 경로에서 도출된 경험 메모리를 기반으로 수정 개입을 안내하기 위해 선택적으로 활성화되는 '느린 경험 주도 모니터'를 통합합니다. 모니터링을 추론-검색 루프에 직접 내재화함으로써, DS-MCM은 언제 개입이 필요한지와 수정 조치가 선행 경험에 의해 어떻게 정보를 얻어야 하는지를 모두 결정합니다. 다양한 딥 검색 벤치마크와 백본 모델을 통한 실험 결과, DS-MCM이 성능과 강건성을 지속적으로 향상시킴을 입증했습니다.
English
Deep search agents powered by large language models have demonstrated strong capabilities in multi-step retrieval, reasoning, and long-horizon task execution. However, their practical failures often stem from the lack of mechanisms to monitor and regulate reasoning and retrieval states as tasks evolve under uncertainty. Insights from cognitive neuroscience suggest that human metacognition is hierarchically organized, integrating fast anomaly detection with selectively triggered, experience-driven reflection. In this work, we propose Deep Search with Meta-Cognitive Monitoring (DS-MCM), a deep search framework augmented with an explicit hierarchical metacognitive monitoring mechanism. DS-MCM integrates a Fast Consistency Monitor, which performs lightweight checks on the alignment between external evidence and internal reasoning confidence, and a Slow Experience-Driven Monitor, which is selectively activated to guide corrective intervention based on experience memory from historical agent trajectories. By embedding monitoring directly into the reasoning-retrieval loop, DS-MCM determines both when intervention is warranted and how corrective actions should be informed by prior experience. Experiments across multiple deep search benchmarks and backbone models demonstrate that DS-MCM consistently improves performance and robustness.