ChatPaper.aiChatPaper

Open-Sora 2.0:20万ドルで商用レベルのビデオ生成モデルをトレーニング

Open-Sora 2.0: Training a Commercial-Level Video Generation Model in $200k

March 12, 2025
著者: Xiangyu Peng, Zangwei Zheng, Chenhui Shen, Tom Young, Xinying Guo, Binluo Wang, Hang Xu, Hongxin Liu, Mingyan Jiang, Wenjun Li, Yuhui Wang, Anbang Ye, Gang Ren, Qianran Ma, Wanying Liang, Xiang Lian, Xiwen Wu, Yuting Zhong, Zhuangyan Li, Chaoyu Gong, Guojun Lei, Leijun Cheng, Limin Zhang, Minghao Li, Ruijie Zhang, Silan Hu, Shijie Huang, Xiaokang Wang, Yuanheng Zhao, Yuqi Wang, Ziang Wei, Yang You
cs.AI

要旨

ビデオ生成モデルはこの1年で目覚ましい進歩を遂げました。AIビデオの品質は向上し続けていますが、その代償としてモデルサイズの拡大、データ量の増加、そしてトレーニング計算資源の需要が高まっています。本レポートでは、わずか20万ドルでトレーニングされた商用レベルのビデオ生成モデル「Open-Sora 2.0」を紹介します。このモデルを通じて、トップクラスのビデオ生成モデルのトレーニングコストが高度に制御可能であることを実証します。データキュレーション、モデルアーキテクチャ、トレーニング戦略、システム最適化など、この効率性のブレークスルーに貢献したすべての技術を詳細に説明します。人間による評価結果とVBenchスコアによると、Open-Sora 2.0はオープンソースのHunyuanVideoやクローズドソースのRunway Gen-3 Alphaを含む世界トップクラスのビデオ生成モデルに匹敵する性能を発揮します。Open-Sora 2.0を完全にオープンソース化することで、先進的なビデオ生成技術へのアクセスを民主化し、コンテンツ制作における幅広いイノベーションと創造性を促進することを目指しています。すべてのリソースは以下のURLで公開されています:https://github.com/hpcaitech/Open-Sora。
English
Video generation models have achieved remarkable progress in the past year. The quality of AI video continues to improve, but at the cost of larger model size, increased data quantity, and greater demand for training compute. In this report, we present Open-Sora 2.0, a commercial-level video generation model trained for only $200k. With this model, we demonstrate that the cost of training a top-performing video generation model is highly controllable. We detail all techniques that contribute to this efficiency breakthrough, including data curation, model architecture, training strategy, and system optimization. According to human evaluation results and VBench scores, Open-Sora 2.0 is comparable to global leading video generation models including the open-source HunyuanVideo and the closed-source Runway Gen-3 Alpha. By making Open-Sora 2.0 fully open-source, we aim to democratize access to advanced video generation technology, fostering broader innovation and creativity in content creation. All resources are publicly available at: https://github.com/hpcaitech/Open-Sora.

Summary

AI-Generated Summary

PDF183March 14, 2025