BEDA: Geloofsschatting als Probabilistische Beperkingen voor het Uitvoeren van Strategische Dialooghandelingen
BEDA: Belief Estimation as Probabilistic Constraints for Performing Strategic Dialogue Acts
December 31, 2025
Auteurs: Hengli Li, Zhaoxin Yu, Qi Shen, Chenxi Li, Mengmeng Wang, Tinglang Wu, Yipeng Kang, Yuxuan Wang, Song-Chun Zhu, Zixia Jia, Zilong Zheng
cs.AI
Samenvatting
Strategische dialoog vereist dat agenten verschillende dialooghandelingen uitvoeren, waarvoor geloofsschatting essentieel is. Hoewel eerder werk vaak geloofsschattingen accuraat uitvoert, ontbreekt een principieel mechanisme om deze geloofsschattingen tijdens generatie te gebruiken. Wij overbruggen deze kloof door eerst twee kernhandelingen te formaliseren – Adversarial en Alignment – en deze te operationaliseren via probabilistische constraints op wat een agent mag genereren. Wij concretiseren dit idee in BEDA, een raamwerk dat bestaat uit de wereldset, de geloofsschatter voor geloofsschatting, en de conditionele generator die handelingen selecteert en uitingen realiseert die consistent zijn met de afgeleide geloofsschattingen. Over drie settings heen – Conditional Keeper Burglar (CKBG, adversarieel), Mutual Friends (MF, coöperatief) en CaSiNo (onderhandeling) – presteert BEDA consistent beter dan sterke baseline-modellen: op CKBG verbetert het het slagingspercentage met minimaal 5,0 punten over verschillende backbones heen en met 20,6 punten bij gebruik van GPT-4.1-nano; op Mutual Friends behaalt het een gemiddelde verbetering van 9,3 punten; en op CaSiNo bereikt het de optimale deal ten opzichte van alle baseline-modellen. Deze resultaten geven aan dat het modelleren van geloofsschatting als constraints een eenvoudig, algemeen mechanisme biedt voor betrouwbare strategische dialoog.
English
Strategic dialogue requires agents to execute distinct dialogue acts, for which belief estimation is essential. While prior work often estimates beliefs accurately, it lacks a principled mechanism to use those beliefs during generation. We bridge this gap by first formalizing two core acts Adversarial and Alignment, and by operationalizing them via probabilistic constraints on what an agent may generate. We instantiate this idea in BEDA, a framework that consists of the world set, the belief estimator for belief estimation, and the conditional generator that selects acts and realizes utterances consistent with the inferred beliefs. Across three settings, Conditional Keeper Burglar (CKBG, adversarial), Mutual Friends (MF, cooperative), and CaSiNo (negotiation), BEDA consistently outperforms strong baselines: on CKBG it improves success rate by at least 5.0 points across backbones and by 20.6 points with GPT-4.1-nano; on Mutual Friends it achieves an average improvement of 9.3 points; and on CaSiNo it achieves the optimal deal relative to all baselines. These results indicate that casting belief estimation as constraints provides a simple, general mechanism for reliable strategic dialogue.