Búsqueda Profunda con Monitoreo Meta-Cognitivo Jerárquico Inspirado en la Neurociencia Cognitiva
Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
January 30, 2026
Autores: Zhongxiang Sun, Qipeng Wang, Weijie Yu, Jingxuan Yang, Haolang Lu, Jun Xu
cs.AI
Resumen
Los agentes de búsqueda profunda impulsados por grandes modelos de lenguaje han demostrado sólidas capacidades en recuperación multi-etapa, razonamiento y ejecución de tareas de largo alcance. Sin embargo, sus fallos prácticos suelen originarse en la falta de mecanismos para monitorizar y regular los estados de razonamiento y recuperación a medida que las tareas evolucionan bajo incertidumbre. Perspectivas de la neurociencia cognitiva sugieren que la metacognición humana está organizada jerárquicamente, integrando la detección rápida de anomalías con una reflexión impulsada por la experiencia y activada selectivamente. En este trabajo, proponemos Búsqueda Profunda con Monitorización Meta-Cognitiva (DS-MCM), un marco de búsqueda profunda aumentado con un mecanismo explícito de monitorización metacognitiva jerárquica. DS-MCM integra un Monitor de Consistencia Rápida, que realiza comprobaciones ligeras sobre la alineación entre la evidencia externa y la confianza interna del razonamiento, y un Monitor Lento Impulsado por la Experiencia, que se activa selectivamente para guiar intervenciones correctivas basadas en la memoria experiencial de trayectorias históricas del agente. Al integrar la monitorización directamente en el bucle de razonamiento-recuperación, DS-MCM determina tanto cuándo está justificada una intervención como cómo las acciones correctivas deben informarse a partir de experiencias previas. Experimentos en múltiples benchmarks de búsqueda profunda y modelos base demuestran que DS-MCM mejora consistentemente el rendimiento y la robustez.
English
Deep search agents powered by large language models have demonstrated strong capabilities in multi-step retrieval, reasoning, and long-horizon task execution. However, their practical failures often stem from the lack of mechanisms to monitor and regulate reasoning and retrieval states as tasks evolve under uncertainty. Insights from cognitive neuroscience suggest that human metacognition is hierarchically organized, integrating fast anomaly detection with selectively triggered, experience-driven reflection. In this work, we propose Deep Search with Meta-Cognitive Monitoring (DS-MCM), a deep search framework augmented with an explicit hierarchical metacognitive monitoring mechanism. DS-MCM integrates a Fast Consistency Monitor, which performs lightweight checks on the alignment between external evidence and internal reasoning confidence, and a Slow Experience-Driven Monitor, which is selectively activated to guide corrective intervention based on experience memory from historical agent trajectories. By embedding monitoring directly into the reasoning-retrieval loop, DS-MCM determines both when intervention is warranted and how corrective actions should be informed by prior experience. Experiments across multiple deep search benchmarks and backbone models demonstrate that DS-MCM consistently improves performance and robustness.