Quantificação da Incerteza Agêntica

Resumo

Embora os agentes de IA tenham demonstrado capacidades impressionantes em raciocínio de longo prazo, sua confiabilidade é severamente comprometida pela "Espiral de Alucinação", onde erros epistêmicos iniciais propagam-se de forma irreversível. Os métodos existentes enfrentam um dilema: as técnicas de quantificação de incerteza (UQ) geralmente atuam como sensores passivos, apenas diagnosticando riscos sem resolvê-los, enquanto os mecanismos de autorreflexão sofrem com correções contínuas ou sem direção. Para preencher essa lacuna, propomos um framework unificado de Quantificação de Incerteza Agêntica de Processo Duplo (AUQ) que transforma a incerteza verbalizada em sinais de controle ativos e bidirecionais. Nossa arquitetura compreende dois mecanismos complementares: o Sistema 1 (Memória Consciente da Incerteza, UAM), que propaga implicitamente a confiança verbalizada e explicações semânticas para evitar a tomada de decisão cega; e o Sistema 2 (Reflexão Consciente da Incerteza, UAR), que utiliza essas explicações como pistas racionais para acionar uma resolução direcionada no momento da inferência, apenas quando necessário. Isso permite ao agente equilibrar dinamicamente a execução eficiente e a deliberação profunda. Experimentos extensivos em benchmarks de circuito fechado e tarefas abertas de pesquisa profunda demonstram que nossa abordagem *training-free* alcança desempenho superior e calibração a nível de trajetória. Acreditamos que este framework fundamentado, AUQ, representa um passo significativo em direção a agentes confiáveis.

English

Although AI agents have demonstrated impressive capabilities in long-horizon reasoning, their reliability is severely hampered by the ``Spiral of Hallucination,'' where early epistemic errors propagate irreversibly. Existing methods face a dilemma: uncertainty quantification (UQ) methods typically act as passive sensors, only diagnosing risks without addressing them, while self-reflection mechanisms suffer from continuous or aimless corrections. To bridge this gap, we propose a unified Dual-Process Agentic UQ (AUQ) framework that transforms verbalized uncertainty into active, bi-directional control signals. Our architecture comprises two complementary mechanisms: System 1 (Uncertainty-Aware Memory, UAM), which implicitly propagates verbalized confidence and semantic explanations to prevent blind decision-making; and System 2 (Uncertainty-Aware Reflection, UAR), which utilizes these explanations as rational cues to trigger targeted inference-time resolution only when necessary. This enables the agent to balance efficient execution and deep deliberation dynamically. Extensive experiments on closed-loop benchmarks and open-ended deep research tasks demonstrate that our training-free approach achieves superior performance and trajectory-level calibration. We believe this principled framework AUQ represents a significant step towards reliable agents.