Monopoly Deal: un ambiente di riferimento per i giochi a risposta unilaterale limitata

Abstract

I giochi di carte sono ampiamente utilizzati per studiare il processo decisionale sequenziale in condizioni di incertezza, con analoghi nel mondo reale in ambiti come negoziazione, finanza e cybersecurity. Questi giochi si classificano tipicamente in tre categorie in base al flusso di controllo: sequenziale stretto (i giocatori alternano azioni singole), risposta deterministica (alcune azioni innescano un esito fisso) e risposta reciproca illimitata (sono permesse contro-mosse alternate). Una struttura meno esplorata ma strategicamente ricca è la risposta unilaterale limitata, in cui l'azione di un giocatore trasferisce temporaneamente il controllo all'avversario, che deve soddisfare una condizione fissa attraverso una o più mosse prima che il turno si risolva. Definiamo i giochi che presentano questo meccanismo come Giochi a Risposta Unilaterale Limitata (BORGs). Presentiamo una versione modificata di Monopoly Deal come ambiente di benchmark che isola questa dinamica, in cui un'azione Affitto costringe l'avversario a scegliere beni per il pagamento. L'algoritmo di riferimento, la Minimizzazione del Rimpianto Controfattuale (CFR), converge su strategie efficaci senza necessità di estensioni algoritmiche innovative. Una piattaforma di ricerca full-stack leggera unifica l'ambiente, un runtime CFR parallelizzato e un'interfaccia web giocabile da umani. L'agente CFR addestrato e il codice sorgente sono disponibili su https://monopolydeal.ai.

English

Card games are widely used to study sequential decision-making under uncertainty, with real-world analogues in negotiation, finance, and cybersecurity. These games typically fall into three categories based on the flow of control: strictly sequential (players alternate single actions), deterministic response (some actions trigger a fixed outcome), and unbounded reciprocal response (alternating counterplays are permitted). A less-explored but strategically rich structure is the bounded one-sided response, where a player's action briefly transfers control to the opponent, who must satisfy a fixed condition through one or more moves before the turn resolves. We term games featuring this mechanism Bounded One-Sided Response Games (BORGs). We introduce a modified version of Monopoly Deal as a benchmark environment that isolates this dynamic, where a Rent action forces the opponent to choose payment assets. The gold-standard algorithm, Counterfactual Regret Minimization (CFR), converges on effective strategies without novel algorithmic extensions. A lightweight full-stack research platform unifies the environment, a parallelized CFR runtime, and a human-playable web interface. The trained CFR agent and source code are available at https://monopolydeal.ai.

Monopoly Deal: un ambiente di riferimento per i giochi a risposta unilaterale limitata

Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games

Abstract

Support