Busca Profunda com Monitoramento Meta-Cognitivo Hierárquico Inspirado na Neurociência Cognitiva
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
January 30, 2026
Autores: Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu, Jun Xu
cs.AI
Resumo
Agentes de busca profunda (deep search) alimentados por grandes modelos de linguagem demonstraram capacidades robustas em recuperação multi-etapas, raciocínio e execução de tarefas de longo horizonte. No entanto, suas falhas práticas frequentemente decorrem da falta de mecanismos para monitorar e regular os estados de raciocínio e recuperação à medida que as tarefas evoluem sob incerteza. Percepções da neurociência cognitiva sugerem que a metacognição humana é organizada hierarquicamente, integrando detecção rápida de anomalias com uma reflexão acionada seletivamente e orientada pela experiência. Neste trabalho, propomos a Busca Profunda com Monitoramento Metacognitivo (DS-MCM), uma estrutura de busca profunda ampliada com um mecanismo explícito e hierárquico de monitoramento metacognitivo. O DS-MCM integra um Monitor de Consistência Rápida, que realiza verificações leves sobre o alinhamento entre evidências externas e a confiança do raciocínio interno, e um Monitor Lento Orientado pela Experiência, que é ativado seletivamente para orientar intervenções corretivas com base na memória experiencial de trajetórias históricas do agente. Ao incorporar o monitoramento diretamente no ciclo de raciocínio-recuperação, o DS-MCM determina tanto quando uma intervenção é necessária quanto como as ações corretivas devem ser informadas por experiências prévias. Experimentos em múltiplos benchmarks de busca profunda e modelos de base (backbone) demonstram que o DS-MCM melhora consistentemente o desempenho e a robustez.
English
Deep search agents powered by large language models have demonstrated strong capabilities in multi-step retrieval, reasoning, and long-horizon task execution. However, their practical failures often stem from the lack of mechanisms to monitor and regulate reasoning and retrieval states as tasks evolve under uncertainty. Insights from cognitive neuroscience suggest that human metacognition is hierarchically organized, integrating fast anomaly detection with selectively triggered, experience-driven reflection. In this work, we propose Deep Search with Meta-Cognitive Monitoring (DS-MCM), a deep search framework augmented with an explicit hierarchical metacognitive monitoring mechanism. DS-MCM integrates a Fast Consistency Monitor, which performs lightweight checks on the alignment between external evidence and internal reasoning confidence, and a Slow Experience-Driven Monitor, which is selectively activated to guide corrective intervention based on experience memory from historical agent trajectories. By embedding monitoring directly into the reasoning-retrieval loop, DS-MCM determines both when intervention is warranted and how corrective actions should be informed by prior experience. Experiments across multiple deep search benchmarks and backbone models demonstrate that DS-MCM consistently improves performance and robustness.