賦予物體生命:從3D物體生成4D。Bringing Objects to Life: 4D generation from 3D objects
最近在生成建模方面的進展現在使得可以通過文本提示來控制的方式創建4D內容(移動的3D物體)。 4D生成在虛擬世界、媒體和遊戲等應用中具有巨大潛力,但現有方法對生成內容的外觀和幾何形狀提供的控制有限。在這項工作中,我們介紹了一種方法,通過條件化文本提示來引導4D生成,從而實現對用戶提供的3D物體進行動畫化,同時保持原始物體的身份。我們首先將3D網格轉換為保留輸入物體視覺屬性的“靜態”4D神經輻射場(NeRF)。然後,我們使用由文本驅動的圖像到視頻擴散模型來對物體進行動畫化。為了提高運動的真實感,我們引入了一種增量視角選擇協議,用於採樣視角以促進逼真的運動,以及一種採用遮罩分散抽樣(SDS)損失的得分蒸餾採樣方法,該方法利用注意力地圖來將優化集中在相關區域。我們通過時間相干性、提示遵循性和視覺保真度來評估我們的模型,發現我們的方法優於基於其他方法的基線,在使用LPIPS分數衡量的身份保留方面實現了最多三倍的改進,並有效平衡了視覺質量與動態內容。