ChatPaper.aiChatPaper

Cuantificación de la Incertidumbre Agéntica

Agentic Uncertainty Quantification

January 22, 2026
Autores: Jiaxin Zhang, Prafulla Kumar Choubey, Kung-Hsiang Huang, Caiming Xiong, Chien-Sheng Wu
cs.AI

Resumen

Si bien los agentes de IA han demostrado capacidades impresionantes en razonamiento de horizonte largo, su fiabilidad se ve severamente limitada por la "Espiral de la Alucinación", donde los errores epistémicos tempranos se propagan irreversiblemente. Los métodos existentes enfrentan un dilema: los métodos de cuantificación de incertidumbre (UQ) suelen actuar como sensores pasivos, solo diagnosticando riesgos sin abordarlos, mientras que los mecanismos de autorreflexión sufren correcciones continuas o sin rumbo. Para cerrar esta brecha, proponemos un marco unificado de UQ Agéntica de Proceso Dual (AUQ) que transforma la incertidumbre verbalizada en señales de control activas y bidireccionales. Nuestra arquitectura comprende dos mecanismos complementarios: el Sistema 1 (Memoria Consciente de la Incertidumbre, UAM), que propaga implícitamente la confianza verbalizada y las explicaciones semánticas para prevenir la toma de decisiones ciega; y el Sistema 2 (Reflexión Consciente de la Incertidumbre, UAR), que utiliza estas explicaciones como pistas racionales para activar una resolución dirigida en tiempo de inferencia solo cuando es necesario. Esto permite al agente equilibrar dinámicamente la ejecución eficiente y la deliberación profunda. Experimentos exhaustivos en benchmarks de bucle cerrado y tareas de investigación profunda de final abierto demuestran que nuestro enfoque libre de entrenamiento logra un rendimiento superior y una calibración a nivel de trayectoria. Creemos que este marco fundamentado, AUQ, representa un paso significativo hacia agentes confiables.
English
Although AI agents have demonstrated impressive capabilities in long-horizon reasoning, their reliability is severely hampered by the ``Spiral of Hallucination,'' where early epistemic errors propagate irreversibly. Existing methods face a dilemma: uncertainty quantification (UQ) methods typically act as passive sensors, only diagnosing risks without addressing them, while self-reflection mechanisms suffer from continuous or aimless corrections. To bridge this gap, we propose a unified Dual-Process Agentic UQ (AUQ) framework that transforms verbalized uncertainty into active, bi-directional control signals. Our architecture comprises two complementary mechanisms: System 1 (Uncertainty-Aware Memory, UAM), which implicitly propagates verbalized confidence and semantic explanations to prevent blind decision-making; and System 2 (Uncertainty-Aware Reflection, UAR), which utilizes these explanations as rational cues to trigger targeted inference-time resolution only when necessary. This enables the agent to balance efficient execution and deep deliberation dynamically. Extensive experiments on closed-loop benchmarks and open-ended deep research tasks demonstrate that our training-free approach achieves superior performance and trajectory-level calibration. We believe this principled framework AUQ represents a significant step towards reliable agents.
PDF11January 24, 2026