ChatPaper.aiChatPaper

MeepleLM: 多様な主観的体験をシミュレートする仮想プレイテスター

MeepleLM: A Virtual Playtester Simulating Diverse Subjective Experiences

January 12, 2026
著者: Zizhen Li, Chuanhao Li, Yibin Wang, Yukang Feng, Jianwen Sun, Jiaxin Ai, Fanrui Zhang, Mingzhu Sun, Yifei Huang, Kaipeng Zhang
cs.AI

要旨

大規模言語モデルのボードゲームにおける役割は、近年の進歩により、単なるプレイングエージェントから創造的な共同デザイナーへと拡大している。しかし、決定的な隔たりが残されている。現在のシステムは、創発的なユーザー体験に基づいた建設的な批評を提供する能力を欠いているのである。この隔たりを埋めることは、人間とAIの協調を調和させるために不可欠である。なぜなら、それはデザイナーが外部の視点を通じて自身の創造物を洗練させると同時に、モデルを偏ったまたは予測不能な結果から遠ざけることを可能にするからだ。 ボードゲームに対する批評の自動化には、2つの課題がある。1つは、明示的なゲームエンジンなしに、ルールとゲームプレイを結びつける潜在的なダイナミクスを推論すること。もう1つは、多様なプレイヤーグループの主観的な多様性をモデル化することである。これらの課題に対処するため、我々は構造的に修正された1,727のルールブックと、品質スコアリングと側面考慮型サンプリングによって選ばれた15万件のレビューからなるデータセットを構築した。このデータをMechanics-Dynamics-Aesthetics(MDA)の推論で拡張し、記述されたルールとプレイヤー体験の間の因果的隔たりを明示的に橋渡しする。さらに、プレイヤーペルソナを蒸留し、特定のペルソナに特化した推論パターンを内在化させ、多様なプレイヤーアーキタイプの主観的フィードバックを正確にシミュレートする専門モデル、MeepleLMを導入する。 実験結果は、MeepleLMがコミュニティとの整合性および批評の質において、最新の商用モデル(GPT-5.1、Gemini3-Proなど)を大きく上回り、有用性を評価するユーザー調査で70%の選好率を達成することを示している。MeepleLMは、一般的なインタラクティブシステムにおける信頼性の高い仮想プレイテスターとして機能し、視聴者に沿った、体験を意識した人間-AI協調への重要な一歩を示すものである。
English
Recent advancements have expanded the role of Large Language Models in board games from playing agents to creative co-designers. However, a critical gap remains: current systems lack the capacity to offer constructive critique grounded in the emergent user experience. Bridging this gap is fundamental for harmonizing Human-AI collaboration, as it empowers designers to refine their creations via external perspectives while steering models away from biased or unpredictable outcomes. Automating critique for board games presents two challenges: inferring the latent dynamics connecting rules to gameplay without an explicit engine, and modeling the subjective heterogeneity of diverse player groups. To address these, we curate a dataset of 1,727 structurally corrected rulebooks and 150K reviews selected via quality scoring and facet-aware sampling. We augment this data with Mechanics-Dynamics-Aesthetics (MDA) reasoning to explicitly bridge the causal gap between written rules and player experience. We further distill player personas and introduce MeepleLM, a specialized model that internalizes persona-specific reasoning patterns to accurately simulate the subjective feedback of diverse player archetypes. Experiments demonstrate that MeepleLM significantly outperforms latest commercial models (e.g., GPT-5.1, Gemini3-Pro) in community alignment and critique quality, achieving a 70% preference rate in user studies assessing utility. MeepleLM serves as a reliable virtual playtester for general interactive systems, marking a pivotal step towards audience-aligned, experience-aware Human-AI collaboration.
PDF82January 27, 2026