Monopoly Deal: un ambiente di riferimento per i giochi a risposta unilaterale limitata
Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games
October 29, 2025
Autori: Will Wolf
cs.AI
Abstract
I giochi di carte sono ampiamente utilizzati per studiare il processo decisionale sequenziale in condizioni di incertezza, con analoghi nel mondo reale in ambiti come negoziazione, finanza e cybersecurity. Questi giochi si classificano tipicamente in tre categorie in base al flusso di controllo: sequenziale stretto (i giocatori alternano azioni singole), risposta deterministica (alcune azioni innescano un esito fisso) e risposta reciproca illimitata (sono permesse contro-mosse alternate). Una struttura meno esplorata ma strategicamente ricca è la risposta unilaterale limitata, in cui l'azione di un giocatore trasferisce temporaneamente il controllo all'avversario, che deve soddisfare una condizione fissa attraverso una o più mosse prima che il turno si risolva. Definiamo i giochi che presentano questo meccanismo come Giochi a Risposta Unilaterale Limitata (BORGs). Presentiamo una versione modificata di Monopoly Deal come ambiente di benchmark che isola questa dinamica, in cui un'azione Affitto costringe l'avversario a scegliere beni per il pagamento. L'algoritmo di riferimento, la Minimizzazione del Rimpianto Controfattuale (CFR), converge su strategie efficaci senza necessità di estensioni algoritmiche innovative. Una piattaforma di ricerca full-stack leggera unifica l'ambiente, un runtime CFR parallelizzato e un'interfaccia web giocabile da umani. L'agente CFR addestrato e il codice sorgente sono disponibili su https://monopolydeal.ai.
English
Card games are widely used to study sequential decision-making under
uncertainty, with real-world analogues in negotiation, finance, and
cybersecurity. These games typically fall into three categories based on the
flow of control: strictly sequential (players alternate single actions),
deterministic response (some actions trigger a fixed outcome), and unbounded
reciprocal response (alternating counterplays are permitted). A less-explored
but strategically rich structure is the bounded one-sided response, where a
player's action briefly transfers control to the opponent, who must satisfy a
fixed condition through one or more moves before the turn resolves. We term
games featuring this mechanism Bounded One-Sided Response Games (BORGs). We
introduce a modified version of Monopoly Deal as a benchmark environment that
isolates this dynamic, where a Rent action forces the opponent to choose
payment assets. The gold-standard algorithm, Counterfactual Regret Minimization
(CFR), converges on effective strategies without novel algorithmic extensions.
A lightweight full-stack research platform unifies the environment, a
parallelized CFR runtime, and a human-playable web interface. The trained CFR
agent and source code are available at https://monopolydeal.ai.