에이전트적 불확실성 정량화
Agentic Uncertainty Quantification
January 22, 2026
저자: Jiaxin Zhang, Prafulla Kumar Choubey, Kung-Hsiang Huang, Caiming Xiong, Chien-Sheng Wu
cs.AI
초록
인공지능 에이전트는 장기적 추론에서 인상적인 능력을 보여왔지만, 초기 인식 오류가 되돌릴 수 없이 확장되는 "환상의 소용돌이"로 인해 그 신뢰성이 심각하게 저해되고 있습니다. 기존 방법론은 딜레마에 직면해 있습니다: 불확실성 정량화(UQ) 방법은 일반적으로 위험을 진단만 할 뿐 해결하지 못하는 수동적 센서 역할에 그치는 반면, 자기 반성 메커니즘은 지속적이거나 목적 없는 수정에 시달립니다. 이러한 차이를 해소하기 위해, 우리는 언어화된 불확실성을 능동적인 양방향 제어 신호로 변환하는 통합된 이중 과정 에이전트 불확실성 정량화(AUQ) 프레임워크를 제안합니다. 우리의 아키텍처는 두 가지 상호 보완적 메커니즘으로 구성됩니다: 암묵적으로 언어화된 신뢰도와 의미론적 설명을 전파하여 맹목적 의사 결정을 방지하는 시스템 1(불확실성 인지 메모리, UAM); 그리고 이러한 설명을 합리적 단서로 활용하여 필요할 때만 표적 추론 시간 해결을 촉발하는 시스템 2(불확실성 인지 반성, UAR). 이를 통해 에이전트는 효율적 실행과 심층 숙고를 동적으로 균형 있게 조정할 수 있습니다. 폐쇄형 벤치마크와 개방형 심층 연구 과제에 대한 광범위한 실험을 통해 우리의 학습 불요 접근법이 우수한 성능과 궤적 수준 보정을 달성함을 입증했습니다. 우리는 이 원칙 기반 프레임워크 AUQ가 신뢰할 수 있는 에이전트로 나아가는 중요한 진전을 나타낸다고 믿습니다.
English
Although AI agents have demonstrated impressive capabilities in long-horizon reasoning, their reliability is severely hampered by the ``Spiral of Hallucination,'' where early epistemic errors propagate irreversibly. Existing methods face a dilemma: uncertainty quantification (UQ) methods typically act as passive sensors, only diagnosing risks without addressing them, while self-reflection mechanisms suffer from continuous or aimless corrections. To bridge this gap, we propose a unified Dual-Process Agentic UQ (AUQ) framework that transforms verbalized uncertainty into active, bi-directional control signals. Our architecture comprises two complementary mechanisms: System 1 (Uncertainty-Aware Memory, UAM), which implicitly propagates verbalized confidence and semantic explanations to prevent blind decision-making; and System 2 (Uncertainty-Aware Reflection, UAR), which utilizes these explanations as rational cues to trigger targeted inference-time resolution only when necessary. This enables the agent to balance efficient execution and deep deliberation dynamically. Extensive experiments on closed-loop benchmarks and open-ended deep research tasks demonstrate that our training-free approach achieves superior performance and trajectory-level calibration. We believe this principled framework AUQ represents a significant step towards reliable agents.