生成式世界探索者Generative World Explorer
在具身體的人工智慧領域中,具有部分觀察能力的規劃是一個核心挑戰。過去的大部分研究是通過開發能夠在環境中進行物理探索以更新對世界狀態信念的代理來應對這一挑戰。相比之下,人類可以透過心智探索想像世界中看不見的部分,並通過想像的觀察來修正他們的信念。這些更新後的信念可以幫助他們做出更明智的決策,而無需始終進行對世界的物理探索。為了實現這種類似人類的能力,我們引入了生成式世界探索器(Genex),這是一個以自我為中心的世界探索框架,允許代理通過心智探索大規模的3D世界(例如城市場景),並獲取想像的觀察來更新其信念。然後,這些更新後的信念將幫助代理在當前步驟做出更明智的決策。為了訓練Genex,我們創建了一個合成的城市場景數據集,Genex-DB。我們的實驗結果表明:(1)Genex能夠在對大型虛擬物理世界進行長期探索時生成高質量且一致的觀察;(2)通過生成的觀察更新的信念可以為現有的決策模型(例如LLM代理)提供信息,從而做出更好的計劃。