MultiGen: 확산 게임 엔진에서 편집 가능한 멀티플레이어 월드를 위한 레벨 디자인
MultiGen: Level-Design for Editable Multiplayer Worlds in Diffusion Game Engines
March 30, 2026
저자: Ryan Po, David Junhao Zhang, Amir Hertz, Gordon Wetzstein, Neal Wadhwa, Nataniel Ruiz
cs.AI
초록
비디오 세계 모델은 상호작용형 시뮬레이션과 엔터테인먼트 분야에서 막대한 잠재력을 보여주고 있으나, 현재 시스템은 여전히 두 가지 중요한 상호작용 측면에서 한계를 겪고 있습니다: 재현 가능하고 편집 가능한 경험을 위한 사용자의 환경 제어, 그리고 플레이어들이 공동 세계에 영향을 미칠 수 있는 공유 추론입니다. 이러한 한계를 해결하기 위해 우리는 시스템에 명시적 외부 메모리를 도입했습니다. 이는 모델의 컨텍스트 윈도우와 독립적으로 운영되는 지속적 상태로서, 사용자 행동에 의해 지속적으로 업데이트되며 생성 롤아웃 전반에 걸쳐 쿼리됩니다. 단순한 다음 프레임 예측기로 작동하는 기존의 확산 게임 엔진과 달리, 우리의 접근 방식은 생성을 메모리, 관찰, 역학 모듈로 분해합니다. 이러한 설계는 편집 가능한 메모리 표현을 통해 사용자에게 환경 구조에 대한 직접적이고 편집 가능한 제어권을 부여하며, 일관된 시점과 플레이어 간 일관된 상호작용을 갖춘 실시간 멀티플레이어 롤아웃으로 자연스럽게 확장됩니다.
English
Video world models have shown immense promise for interactive simulation and entertainment, but current systems still struggle with two important aspects of interactivity: user control over the environment for reproducible, editable experiences, and shared inference where players hold influence over a common world. To address these limitations, we introduce an explicit external memory into the system, a persistent state operating independent of the model's context window, that is continually updated by user actions and queried throughout the generation roll-out. Unlike conventional diffusion game engines that operate as next-frame predictors, our approach decomposes generation into Memory, Observation, and Dynamics modules. This design gives users direct, editable control over environment structure via an editable memory representation, and it naturally extends to real-time multiplayer rollouts with coherent viewpoints and consistent cross-player interactions.