ReactiveGWM: リアクティブゲームワールドモデルにおけるNPCの誘導
ReactiveGWM: Steering NPC in Reactive Game World Models
May 14, 2026
著者: Zeqing Wang, Danze Chen, Zhaohu Xing, Zizhao Tong, Yinhan Zhang, Xingyi Yang, Yeying Jin
cs.AI
要旨
現在のゲーム世界モデルは、主観的かつプレイヤー中心の視点から環境をシミュレートする。しかし、ノンプレイヤーキャラクター(NPC)を単なる背景ピクセルとして扱うため、これらのモデルはプレイヤーとNPC間の相互作用を捉えることができない。その意味で、それらは真のシミュレーションエンジンではなく、受動的な映像レンダラーとして機能し、行動によって誘発されるNPCの反応をモデル化するために必要な物理的理解を欠いている。我々は、プレイヤーとNPC間の動的相互作用を合成する反応型ゲーム世界モデルであるReactiveGWMを提案する。ReactiveGWMは、すべての相互作用ダイナミクスを混在させるのではなく、プレイヤーの操作とNPCの振る舞いを明示的に分離する。プレイヤーの行動は、軽量な加算バイアスを介して拡散バックボーンに注入され、一方で高レベルのNPC応答(例:攻撃、制御、防御)はクロスアテンションモジュールを通じて接地される。重要なのは、これらのモジュールがインタラクティブなロジックのゲーム非依存表現を学習する点である。これにより、ゼロショット戦略転送が可能となる。すなわち、学習されたモジュールは、異なるゲームの既製で未注釈の世界モデルに直接プラグインできる。これにより、ドメイン固有の再学習なしに、操作可能なNPCインタラクションを即座に実現する。2つのストリートファイターゲームで評価した結果、ReactiveGWMは細粒度のプレイヤー制御性を維持しつつ、プロンプトに沿った堅牢なNPC戦略順守を達成し、拡張可能で戦略に富んだNPCとのインタラクションへの道を拓く。
English
Current game world models simulate environments from a subjective, player-centric perspective. However, by treating the Non-Player Character (NPC) merely as background pixels, these models cannot capture interactions between the player and NPC. In that sense, they act as passive video renderers rather than real simulation engines, lacking the physical understanding needed to model action-induced NPC reactivities. We introduce ReactiveGWM, a reactive game world model that synthesizes dynamic interactions between the player and NPC. Instead of entangling all interaction dynamics, ReactiveGWM explicitly decouples player controls from NPC behaviors. Player actions are injected into the diffusion backbone via a lightweight additive bias, while high-level NPC responses (e.g., Offense, Control, Defense) are grounded through cross-attention modules. Crucially, these modules learn a game-agnostic representation of interactive logic. This enables zero-shot strategy transfer: our learned modules can be plugged directly into off-the-shelf, unannotated world models of different games. This instantly unlocks steerable NPC interactions without any domain-specific retraining. Evaluated on two Street Fighter games, ReactiveGWM maintains fine-grain player controllability while achieving robust, prompt-aligned NPC strategy adherence, paving the way for scalable, strategy-rich interaction with the NPC.