ReactiveGWM: Управление NPC в реактивных моделях игрового мира
ReactiveGWM: Steering NPC in Reactive Game World Models
May 14, 2026
Авторы: Zeqing Wang, Danze Chen, Zhaohu Xing, Zizhao Tong, Yinhan Zhang, Xingyi Yang, Yeying Jin
cs.AI
Аннотация
Современные игровые модели мира моделируют окружение с субъективной, центрированной на игроке перспективы. Однако, рассматривая неигрового персонажа (NPC) просто как фоновые пиксели, эти модели не способны улавливать взаимодействия между игроком и NPC. В этом смысле они действуют как пассивные видеорендеры, а не как настоящие симуляционные движки, лишенные физического понимания, необходимого для моделирования реакций NPC, вызванных действиями. Мы представляем ReactiveGWM — реактивную игровую модель мира, которая синтезирует динамические взаимодействия между игроком и NPC. Вместо того чтобы запутывать все динамики взаимодействий, ReactiveGWM явным образом разделяет управление игроком и поведение NPC. Действия игрока внедряются в диффузионный бэкбон через легковесное аддитивное смещение, а высокоуровневые реакции NPC (например, «атака», «контроль», «защита») заземляются через модули перекрестного внимания. Ключевым моментом является то, что эти модули обучаются независимому от игры представлению интерактивной логики. Это обеспечивает zero-shot перенос стратегии: наши обученные модули могут быть напрямую вставлены в готовые, неаннотированные модели мира из разных игр. Это мгновенно открывает управляемые взаимодействия с NPC без какого-либо переобучения под конкретную область. В оценке на двух играх Street Fighter, ReactiveGWM сохраняет точное управление игроком, одновременно обеспечивая надежное следование стратегии NPC в соответствии с подсказками, прокладывая путь к масштабируемым, насыщенным стратегиями взаимодействиям с NPC.
English
Current game world models simulate environments from a subjective, player-centric perspective. However, by treating the Non-Player Character (NPC) merely as background pixels, these models cannot capture interactions between the player and NPC. In that sense, they act as passive video renderers rather than real simulation engines, lacking the physical understanding needed to model action-induced NPC reactivities. We introduce ReactiveGWM, a reactive game world model that synthesizes dynamic interactions between the player and NPC. Instead of entangling all interaction dynamics, ReactiveGWM explicitly decouples player controls from NPC behaviors. Player actions are injected into the diffusion backbone via a lightweight additive bias, while high-level NPC responses (e.g., Offense, Control, Defense) are grounded through cross-attention modules. Crucially, these modules learn a game-agnostic representation of interactive logic. This enables zero-shot strategy transfer: our learned modules can be plugged directly into off-the-shelf, unannotated world models of different games. This instantly unlocks steerable NPC interactions without any domain-specific retraining. Evaluated on two Street Fighter games, ReactiveGWM maintains fine-grain player controllability while achieving robust, prompt-aligned NPC strategy adherence, paving the way for scalable, strategy-rich interaction with the NPC.