Seaweed-7B: Экономически эффективное обучение базовой модели для генерации видеоSeaweed-7B: Cost-Effective Training of Video Generation Foundation Model
В данном техническом отчете представлена экономически эффективная стратегия обучения базовой модели для генерации видео. Мы представляем исследовательскую модель среднего размера с примерно 7 миллиардами параметров (7B), названную Seaweed-7B, которая была обучена с нуля с использованием 665 000 часов работы GPU H100. Несмотря на обучение с умеренными вычислительными ресурсами, Seaweed-7B демонстрирует высококонкурентную производительность по сравнению с современными моделями генерации видео значительно большего размера. В условиях ограниченных ресурсов особенно важны продуманные проектные решения. В этом техническом отчете выделены ключевые проектные решения, которые повышают производительность модели диффузии среднего размера. Эмпирически мы делаем два наблюдения: (1) Seaweed-7B достигает производительности, сопоставимой или даже превосходящей более крупные модели, обученные с использованием значительно больших вычислительных ресурсов, и (2) наша модель, обладающая сильной способностью к обобщению, может быть эффективно адаптирована для широкого спектра прикладных задач либо путем легкой дообучения, либо продолжения обучения. Подробнее на странице проекта: https://seaweed.video/