Seaweed-7B: Entrenamiento Rentable de un Modelo Base para la Generación de VídeosSeaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Este informe técnico presenta una estrategia rentable para entrenar un modelo base de generación de videos. Introducimos un modelo de investigación de tamaño medio con aproximadamente 7 mil millones de parámetros (7B), denominado Seaweed-7B, entrenado desde cero utilizando 665,000 horas de GPU H100. A pesar de haber sido entrenado con recursos computacionales moderados, Seaweed-7B demuestra un rendimiento altamente competitivo en comparación con modelos contemporáneos de generación de videos de tamaño mucho mayor. Las decisiones de diseño son especialmente cruciales en un entorno con recursos limitados. Este informe técnico destaca las decisiones clave de diseño que mejoran el rendimiento del modelo de difusión de tamaño medio. Empíricamente, observamos dos aspectos: (1) Seaweed-7B logra un rendimiento comparable o incluso superior al de modelos más grandes entrenados con recursos de GPU sustancialmente mayores, y (2) nuestro modelo, que exhibe una fuerte capacidad de generalización, puede adaptarse eficazmente a una amplia gama de aplicaciones posteriores mediante ajustes finos ligeros o continuando el entrenamiento. Consulte la página del proyecto en https://seaweed.video/.