ChatPaper.aiChatPaper

MeepleLM: 다양한 주관적 경험을 시뮬레이션하는 가상 플레이테스터

MeepleLM: A Virtual Playtester Simulating Diverse Subjective Experiences

January 12, 2026
저자: Zizhen Li, Chuanhao Li, Yibin Wang, Yukang Feng, Jianwen Sun, Jiaxin Ai, Fanrui Zhang, Mingzhu Sun, Yifei Huang, Kaipeng Zhang
cs.AI

초록

최근의 발전으로 인공대화모델의 보드게임에서의 역할이 플레이 에이전트에서 창의적 공동 설계자로 확장되었습니다. 그러나 중요한 공백이 남아있습니다: 현재 시스템은 발생적 사용자 경험에 기반한 건설적 비판을 제공할 능력이 부족합니다. 이 공백을 메우는 것은 인간-AI 협력을 조화시키기 위한 핵심 과제로, 설계자가 외부 시각을 통해 자신의 창작물을 개선할 수 있도록 돕는 동시에 모델이 편향되거나 예측 불가능한 결과에서 벗어나도록 안내하기 때문입니다. 보드게임에 대한 비판 자동화는 두 가지 어려움을 제시합니다: 명시적 엔진 없이 규칙과 게임플레이를 연결하는 잠재적 역학을 추론하는 것, 그리고 다양한 플레이어 그룹의 주관적 이질성을 모델링하는 것입니다. 이를 해결하기 위해 우리는 구조적으로 정제된 1,727개의 규칙서와 품질 점수 및 측면 인식 샘플링을 통해 선별된 15만 개의 리뷰로 구성된 데이터셋을 구축했습니다. 우리는 이 데이터에 역학-메커니즘-미학(MDA) 추론을 추가하여 서면 규칙과 플레이어 경험 간의 인과적 간극을 명시적으로 연결합니다. 더 나아가 플레이어 페르소나를 정제하고 MeepleLM을 소개합니다. 이는 특화된 모델로 다양한 플레이어 유형의 주관적 피드백을 정확하게 시뮬레이션하기 위해 페르소나 특정 추론 패턴을 내재화합니다. 실험 결과 MeepleLM은 커뮤니티 정렬 및 비판 품질에서 최신 상용 모델(GPT-5.1, Gemini3-Pro 등)을 크게 능가하며, 유용성 평가 사용자 연구에서 70%의 선호도를 달성했습니다. MeepleLM은 일반 상호작용 시스템을 위한 신뢰할 수 있는 가상 플레이테스터 역할을 하여, 관객 정렬 및 경험 인식 인간-AI 협력으로 나아가는 중대한 단계를 표방합니다.
English
Recent advancements have expanded the role of Large Language Models in board games from playing agents to creative co-designers. However, a critical gap remains: current systems lack the capacity to offer constructive critique grounded in the emergent user experience. Bridging this gap is fundamental for harmonizing Human-AI collaboration, as it empowers designers to refine their creations via external perspectives while steering models away from biased or unpredictable outcomes. Automating critique for board games presents two challenges: inferring the latent dynamics connecting rules to gameplay without an explicit engine, and modeling the subjective heterogeneity of diverse player groups. To address these, we curate a dataset of 1,727 structurally corrected rulebooks and 150K reviews selected via quality scoring and facet-aware sampling. We augment this data with Mechanics-Dynamics-Aesthetics (MDA) reasoning to explicitly bridge the causal gap between written rules and player experience. We further distill player personas and introduce MeepleLM, a specialized model that internalizes persona-specific reasoning patterns to accurately simulate the subjective feedback of diverse player archetypes. Experiments demonstrate that MeepleLM significantly outperforms latest commercial models (e.g., GPT-5.1, Gemini3-Pro) in community alignment and critique quality, achieving a 70% preference rate in user studies assessing utility. MeepleLM serves as a reliable virtual playtester for general interactive systems, marking a pivotal step towards audience-aligned, experience-aware Human-AI collaboration.
PDF82January 27, 2026