游戏工厂:利用生成交互式视频创造新游戏GameFactory: Creating New Games with Generative Interactive Videos
生成式游戏引擎有潜力彻底改变游戏开发,通过自主创建新内容和减少手动工作量。然而,现有基于视频的游戏生成方法未能解决场景泛化的关键挑战,限制了它们适用于具有固定风格和场景的现有游戏。在本文中,我们提出了GameFactory,一个专注于探索游戏视频生成中场景泛化的框架。为了实现全新和多样化游戏的创作,我们利用在开放域视频数据上训练的预训练视频扩散模型。为了弥合开放域先验和小规模游戏数据集之间的领域差距,我们提出了一个多阶段训练策略,将游戏风格学习与动作控制解耦,保持开放域泛化同时实现动作可控性。利用Minecraft作为我们的数据来源,我们发布了GF-Minecraft,一个高质量且多样化的动作注释视频数据集供研究使用。此外,我们扩展了我们的框架,实现自回归动作可控的游戏视频生成,实现无限长度的互动游戏视频制作。实验结果表明,GameFactory有效生成开放域、多样化和动作可控的游戏视频,代表了人工智能驱动游戏生成的重要进展。我们的数据集和项目页面可在https://vvictoryuki.github.io/gamefactory/公开获取。