Seaweed-7B:视频生成基础模型的高效低成本训练Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model
本技术报告提出了一种经济高效的视频生成基础模型训练策略。我们介绍了一个中等规模的研究模型,名为Seaweed-7B,拥有约70亿参数(7B),从零开始训练共消耗了665,000小时的H100 GPU算力。尽管在计算资源有限的情况下进行训练,Seaweed-7B相较于规模大得多的当代视频生成模型,展现出了极具竞争力的性能。在资源受限的环境中,设计选择尤为关键。本报告着重阐述了提升中等规模扩散模型性能的关键设计决策。通过实证研究,我们得出两点观察:(1) Seaweed-7B在性能上可与甚至超越那些消耗了更多GPU资源训练的大型模型相媲美;(2) 我们的模型展现出强大的泛化能力,能够通过轻量级微调或持续训练,有效适应广泛的下游应用场景。更多详情请访问项目页面:https://seaweed.video/。