Monopoly Deal: Eine Benchmark-Umgebung für beschränkte einseitige Antwortspiele

papers.abstract

Kartenspiele werden häufig zur Erforschung sequenzieller Entscheidungsfindung unter Unsicherheit eingesetzt, mit realweltlichen Analogien in Verhandlungen, Finanzen und Cybersicherheit. Diese Spiele lassen sich typischerweise anhand des Kontrollflusses in drei Kategorien einteilen: streng sequenziell (Spieler führen abwechselnd einzelne Aktionen aus), deterministische Antwortbestimmung (bestimmte Aktionen lösen ein festgelegtes Ergebnis aus) und unbegrenzte wechselseitige Antwortbestimmung (abwechselnde Gegenspielzüge sind erlaubt). Eine weniger erforschte, aber strategisch reichhaltige Struktur ist die begrenzte einseitige Antwortbestimmung, bei der die Aktion eines Spielers die Kontrolle kurzzeitig auf den Gegner überträgt. Dieser muss dann eine festgelegte Bedingung durch einen oder mehrere Züge erfüllen, bevor der Zug abgeschlossen wird. Wir bezeichnen Spiele, die diesen Mechanismus enthalten, als Bounded One-Sided Response Games (BORGs). Wir stellen eine modifizierte Version von Monopoly Deal als Benchmark-Umgebung vor, die diese Dynamik isoliert: Dabei zwingt eine Miet-Aktion den Gegner, Zahlungsvermögen auszuwählen. Der Goldstandard-Algorithmus, Counterfactual Regret Minimization (CFR), konvergiert ohne neue algorithmische Erweiterungen auf effektive Strategien. Eine schlanke Full-Stack-Forschungsplattform vereint die Umgebung, eine parallelisierte CFR-Laufzeitumgebung und eine für Menschen spielbare Weboberfläche. Der trainierte CFR-Agent und der Quellcode sind unter https://monopolydeal.ai verfügbar.

English

Card games are widely used to study sequential decision-making under uncertainty, with real-world analogues in negotiation, finance, and cybersecurity. These games typically fall into three categories based on the flow of control: strictly sequential (players alternate single actions), deterministic response (some actions trigger a fixed outcome), and unbounded reciprocal response (alternating counterplays are permitted). A less-explored but strategically rich structure is the bounded one-sided response, where a player's action briefly transfers control to the opponent, who must satisfy a fixed condition through one or more moves before the turn resolves. We term games featuring this mechanism Bounded One-Sided Response Games (BORGs). We introduce a modified version of Monopoly Deal as a benchmark environment that isolates this dynamic, where a Rent action forces the opponent to choose payment assets. The gold-standard algorithm, Counterfactual Regret Minimization (CFR), converges on effective strategies without novel algorithmic extensions. A lightweight full-stack research platform unifies the environment, a parallelized CFR runtime, and a human-playable web interface. The trained CFR agent and source code are available at https://monopolydeal.ai.

Monopoly Deal: Eine Benchmark-Umgebung für beschränkte einseitige Antwortspiele

Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games

papers.abstract

Support