Monopoly Deal: Um Ambiente de Referência para Jogos de Resposta Unilateral Limitada

Resumo

Os jogos de cartas são amplamente utilizados para estudar a tomada de decisão sequencial sob incerteza, com análogos no mundo real em negociação, finanças e cibersegurança. Esses jogos geralmente se enquadram em três categorias com base no fluxo de controle: estritamente sequencial (os jogadores alternam ações individuais), resposta determinística (algumas ações desencadeiam um resultado fixo) e resposta recíproca ilimitada (contrajogadas alternadas são permitidas). Uma estrutura menos explorada, mas estrategicamente rica, é a da resposta unilateral limitada, na qual uma ação de um jogador transfere brevemente o controle para o oponente, que deve satisfazer uma condição fixa por meio de uma ou mais jogadas antes que o turno seja resolvido. Denominamos os jogos que apresentam esse mecanismo de Jogos de Resposta Unilateral Limitada (BORGs, do inglês). Apresentamos uma versão modificada do Monopoly Deal como um ambiente de referência que isola essa dinâmica, na qual uma ação de Aluguel força o oponente a escolher ativos para pagamento. O algoritmo considerado estado da arte, Minimização de Arrependimento Contrafactual (CFR, do inglês), converge para estratégias eficazes sem a necessidade de novas extensões algorítmicas. Uma plataforma de pesquisa full-stack leve unifica o ambiente, um tempo de execução CFR paralelizado e uma interface web jogável por humanos. O agente CFR treinado e o código-fonte estão disponíveis em https://monopolydeal.ai.

English

Card games are widely used to study sequential decision-making under uncertainty, with real-world analogues in negotiation, finance, and cybersecurity. These games typically fall into three categories based on the flow of control: strictly sequential (players alternate single actions), deterministic response (some actions trigger a fixed outcome), and unbounded reciprocal response (alternating counterplays are permitted). A less-explored but strategically rich structure is the bounded one-sided response, where a player's action briefly transfers control to the opponent, who must satisfy a fixed condition through one or more moves before the turn resolves. We term games featuring this mechanism Bounded One-Sided Response Games (BORGs). We introduce a modified version of Monopoly Deal as a benchmark environment that isolates this dynamic, where a Rent action forces the opponent to choose payment assets. The gold-standard algorithm, Counterfactual Regret Minimization (CFR), converges on effective strategies without novel algorithmic extensions. A lightweight full-stack research platform unifies the environment, a parallelized CFR runtime, and a human-playable web interface. The trained CFR agent and source code are available at https://monopolydeal.ai.