Seaweed-7B:高效成本訓練的視頻生成基礎模型Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
本技術報告提出了一種成本效益高的策略,用於訓練視頻生成基礎模型。我們介紹了一個中等規模的研究模型,名為Seaweed-7B,該模型約有70億參數(7B),並從零開始訓練,使用了665,000個H100 GPU小時。儘管訓練時使用了適中的計算資源,Seaweed-7B在與當代更大規模的視頻生成模型相比時,展現出了極具競爭力的性能。在資源受限的環境中,設計選擇尤為關鍵。本技術報告強調了提升中等規模擴散模型性能的關鍵設計決策。根據實證研究,我們得出兩個觀察結果:(1)Seaweed-7B的表現可與使用更多GPU資源訓練的更大模型相媲美,甚至超越;(2)我們的模型展現出強大的泛化能力,能夠通過輕量級微調或繼續訓練,有效地適應廣泛的下游應用。詳見項目頁面:https://seaweed.video/。