Monopoly Deal: Um Ambiente de Referência para Jogos de Resposta Unilateral Limitada
Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games
October 29, 2025
Autores: Will Wolf
cs.AI
Resumo
Os jogos de cartas são amplamente utilizados para estudar a tomada de decisão sequencial sob incerteza, com análogos no mundo real em negociação, finanças e cibersegurança. Esses jogos geralmente se enquadram em três categorias com base no fluxo de controle: estritamente sequencial (os jogadores alternam ações individuais), resposta determinística (algumas ações desencadeiam um resultado fixo) e resposta recíproca ilimitada (contrajogadas alternadas são permitidas). Uma estrutura menos explorada, mas estrategicamente rica, é a da resposta unilateral limitada, na qual uma ação de um jogador transfere brevemente o controle para o oponente, que deve satisfazer uma condição fixa por meio de uma ou mais jogadas antes que o turno seja resolvido. Denominamos os jogos que apresentam esse mecanismo de Jogos de Resposta Unilateral Limitada (BORGs, do inglês). Apresentamos uma versão modificada do Monopoly Deal como um ambiente de referência que isola essa dinâmica, na qual uma ação de Aluguel força o oponente a escolher ativos para pagamento. O algoritmo considerado estado da arte, Minimização de Arrependimento Contrafactual (CFR, do inglês), converge para estratégias eficazes sem a necessidade de novas extensões algorítmicas. Uma plataforma de pesquisa full-stack leve unifica o ambiente, um tempo de execução CFR paralelizado e uma interface web jogável por humanos. O agente CFR treinado e o código-fonte estão disponíveis em https://monopolydeal.ai.
English
Card games are widely used to study sequential decision-making under
uncertainty, with real-world analogues in negotiation, finance, and
cybersecurity. These games typically fall into three categories based on the
flow of control: strictly sequential (players alternate single actions),
deterministic response (some actions trigger a fixed outcome), and unbounded
reciprocal response (alternating counterplays are permitted). A less-explored
but strategically rich structure is the bounded one-sided response, where a
player's action briefly transfers control to the opponent, who must satisfy a
fixed condition through one or more moves before the turn resolves. We term
games featuring this mechanism Bounded One-Sided Response Games (BORGs). We
introduce a modified version of Monopoly Deal as a benchmark environment that
isolates this dynamic, where a Rent action forces the opponent to choose
payment assets. The gold-standard algorithm, Counterfactual Regret Minimization
(CFR), converges on effective strategies without novel algorithmic extensions.
A lightweight full-stack research platform unifies the environment, a
parallelized CFR runtime, and a human-playable web interface. The trained CFR
agent and source code are available at https://monopolydeal.ai.