生成世界探索器Generative World Explorer
在具身体实体的人工智能中,带有部分观测的规划是一个核心挑战。大多数先前的研究通过开发能够在环境中进行物理探索以更新其对世界状态的信念的代理来解决这一挑战。相比之下,人类可以通过心理探索想象看不见的世界部分,并通过想象的观测修订他们的信念。这种更新后的信念可以帮助他们做出更明智的决策,而无需始终进行世界的物理探索。为了实现这种类似人类的能力,我们引入了生成式世界探索器(Genex),这是一个以自我为中心的世界探索框架,允许代理在大规模的3D世界(例如城市场景)中进行心理探索,并获取想象的观测来更新其信念。然后,这种更新后的信念将帮助代理在当前步骤做出更明智的决策。为了训练Genex,我们创建了一个合成的城市场景数据集,Genex-DB。我们的实验结果表明:(1)Genex能够在长时间跨度的大型虚拟物理世界探索中生成高质量且一致的观测;(2)通过生成的观测更新的信念可以为现有的决策模型(例如LLM代理)提供信息,从而制定更好的计划。