BEDA: 戦略的対話行為遂行のための確率的制約としての信念推定
BEDA: Belief Estimation as Probabilistic Constraints for Performing Strategic Dialogue Acts
December 31, 2025
著者: Hengli Li, Zhaoxin Yu, Qi Shen, Chenxi Li, Mengmeng Wang, Tinglang Wu, Yipeng Kang, Yuxuan Wang, Song-Chun Zhu, Zixia Jia, Zilong Zheng
cs.AI
要旨
戦略的対話では、エージェントが個別の発話行為を実行する必要があり、そのためには信念推定が不可欠である。従来の研究では信念を正確に推定するものが多いが、生成時にそれらの信念を利用する原理的なメカニズムが欠如している。我々はこの隔たりを埋めるため、まず「敵対的」と「協調的」という二つの核心的行為を形式化し、それらをエージェントが生成し得る発話に対する確率的制約として操作化する。この考え方を具体化したBEDAフレームワークは、世界集合、信念推定のための信念推定器、および推定された信念と整合性のある行為の選択と発話の実現を行う条件付き生成器で構成される。Conditional Keeper Burglar(CKBG、敵対的)、Mutual Friends(MF、協調的)、CaSiNo(交渉)の3設定において、BEDAは強力なベースラインを一貫して上回った:CKBGではバックボーン間で成功率を少なくとも5.0ポイント向上させ、GPT-4.1-nanoでは20.6ポイントの向上を達成;Mutual Friendsでは平均9.3ポイントの改善を達成;CaSiNoでは全てのベースラインに対して最適な合意を達成した。これらの結果は、信念推定を制約として定式化することが、信頼性の高い戦略的対話のための簡潔で汎用的なメカニズムを提供することを示唆している。
English
Strategic dialogue requires agents to execute distinct dialogue acts, for which belief estimation is essential. While prior work often estimates beliefs accurately, it lacks a principled mechanism to use those beliefs during generation. We bridge this gap by first formalizing two core acts Adversarial and Alignment, and by operationalizing them via probabilistic constraints on what an agent may generate. We instantiate this idea in BEDA, a framework that consists of the world set, the belief estimator for belief estimation, and the conditional generator that selects acts and realizes utterances consistent with the inferred beliefs. Across three settings, Conditional Keeper Burglar (CKBG, adversarial), Mutual Friends (MF, cooperative), and CaSiNo (negotiation), BEDA consistently outperforms strong baselines: on CKBG it improves success rate by at least 5.0 points across backbones and by 20.6 points with GPT-4.1-nano; on Mutual Friends it achieves an average improvement of 9.3 points; and on CaSiNo it achieves the optimal deal relative to all baselines. These results indicate that casting belief estimation as constraints provides a simple, general mechanism for reliable strategic dialogue.