BEDA: Estimativa de Crenças como Restrições Probabilísticas para a Execução de Atos de Diálogo Estratégicos

Resumo

O diálogo estratégico requer que os agentes executem atos de diálogo distintos, para os quais a estimativa de crenças é essencial. Embora trabalhos anteriores frequentemente estimem crenças com precisão, falta-lhes um mecanismo fundamentado para utilizar essas crenças durante a geração. Colmatamos esta lacuna, primeiro formalizando dois atos centrais – Adversarial e Alinhamento – e operacionalizando-os através de restrições probabilísticas sobre o que um agente pode gerar. Instanciamos esta ideia no BEDA, uma estrutura que consiste no conjunto mundial, no estimador de crenças para estimativa de crenças e no gerador condicional que seleciona atos e realiza enunciados consistentes com as crenças inferidas. Em três contextos – Conditional Keeper Burglar (CKBG, adversarial), Mutual Friends (MF, cooperativo) e CaSiNo (negociação) – o BEDA supera consistentemente baselines robustas: no CKBG, melhora a taxa de sucesso em pelo menos 5,0 pontos across backbones e em 20,6 pontos com GPT-4.1-nano; no Mutual Friends, alcança uma melhoria média de 9,3 pontos; e no CaSiNo, atinge o acordo ótimo em relação a todas as baselines. Estes resultados indicam que moldar a estimativa de crenças como restrições fornece um mecanismo simples e geral para um diálogo estratégico confiável.

English

Strategic dialogue requires agents to execute distinct dialogue acts, for which belief estimation is essential. While prior work often estimates beliefs accurately, it lacks a principled mechanism to use those beliefs during generation. We bridge this gap by first formalizing two core acts Adversarial and Alignment, and by operationalizing them via probabilistic constraints on what an agent may generate. We instantiate this idea in BEDA, a framework that consists of the world set, the belief estimator for belief estimation, and the conditional generator that selects acts and realizes utterances consistent with the inferred beliefs. Across three settings, Conditional Keeper Burglar (CKBG, adversarial), Mutual Friends (MF, cooperative), and CaSiNo (negotiation), BEDA consistently outperforms strong baselines: on CKBG it improves success rate by at least 5.0 points across backbones and by 20.6 points with GPT-4.1-nano; on Mutual Friends it achieves an average improvement of 9.3 points; and on CaSiNo it achieves the optimal deal relative to all baselines. These results indicate that casting belief estimation as constraints provides a simple, general mechanism for reliable strategic dialogue.

BEDA: Estimativa de Crenças como Restrições Probabilísticas para a Execução de Atos de Diálogo Estratégicos

BEDA: Belief Estimation as Probabilistic Constraints for Performing Strategic Dialogue Acts

Resumo

Support