Monopoly Deal: Eine Benchmark-Umgebung für beschränkte einseitige Antwortspiele
Monopoly Deal: A Benchmark Environment for Bounded One-Sided Response Games
October 29, 2025
papers.authors: Will Wolf
cs.AI
papers.abstract
Kartenspiele werden häufig zur Erforschung sequenzieller Entscheidungsfindung unter Unsicherheit eingesetzt, mit realweltlichen Analogien in Verhandlungen, Finanzen und Cybersicherheit. Diese Spiele lassen sich typischerweise anhand des Kontrollflusses in drei Kategorien einteilen: streng sequenziell (Spieler führen abwechselnd einzelne Aktionen aus), deterministische Antwortbestimmung (bestimmte Aktionen lösen ein festgelegtes Ergebnis aus) und unbegrenzte wechselseitige Antwortbestimmung (abwechselnde Gegenspielzüge sind erlaubt). Eine weniger erforschte, aber strategisch reichhaltige Struktur ist die begrenzte einseitige Antwortbestimmung, bei der die Aktion eines Spielers die Kontrolle kurzzeitig auf den Gegner überträgt. Dieser muss dann eine festgelegte Bedingung durch einen oder mehrere Züge erfüllen, bevor der Zug abgeschlossen wird. Wir bezeichnen Spiele, die diesen Mechanismus enthalten, als Bounded One-Sided Response Games (BORGs). Wir stellen eine modifizierte Version von Monopoly Deal als Benchmark-Umgebung vor, die diese Dynamik isoliert: Dabei zwingt eine Miet-Aktion den Gegner, Zahlungsvermögen auszuwählen. Der Goldstandard-Algorithmus, Counterfactual Regret Minimization (CFR), konvergiert ohne neue algorithmische Erweiterungen auf effektive Strategien. Eine schlanke Full-Stack-Forschungsplattform vereint die Umgebung, eine parallelisierte CFR-Laufzeitumgebung und eine für Menschen spielbare Weboberfläche. Der trainierte CFR-Agent und der Quellcode sind unter https://monopolydeal.ai verfügbar.
English
Card games are widely used to study sequential decision-making under
uncertainty, with real-world analogues in negotiation, finance, and
cybersecurity. These games typically fall into three categories based on the
flow of control: strictly sequential (players alternate single actions),
deterministic response (some actions trigger a fixed outcome), and unbounded
reciprocal response (alternating counterplays are permitted). A less-explored
but strategically rich structure is the bounded one-sided response, where a
player's action briefly transfers control to the opponent, who must satisfy a
fixed condition through one or more moves before the turn resolves. We term
games featuring this mechanism Bounded One-Sided Response Games (BORGs). We
introduce a modified version of Monopoly Deal as a benchmark environment that
isolates this dynamic, where a Rent action forces the opponent to choose
payment assets. The gold-standard algorithm, Counterfactual Regret Minimization
(CFR), converges on effective strategies without novel algorithmic extensions.
A lightweight full-stack research platform unifies the environment, a
parallelized CFR runtime, and a human-playable web interface. The trained CFR
agent and source code are available at https://monopolydeal.ai.