Seaweed-7B: Kosteneffectieve training van een fundamenteel model voor videogeneratieSeaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Dit technisch rapport presenteert een kostenefficiënte strategie voor het trainen van een foundation model voor videogeneratie. We introduceren een middelgroot onderzoeksmodel met ongeveer 7 miljard parameters (7B), genaamd Seaweed-7B, dat vanaf nul is getraind met behulp van 665.000 H100 GPU-uren. Ondanks het feit dat het is getraind met matige rekenbronnen, toont Seaweed-7B een zeer competitieve prestaties in vergelijking met hedendaagse videogeneratiemodellen van aanzienlijk grotere omvang. Ontwerpkeuzes zijn vooral cruciaal in een omgeving met beperkte middelen. Dit technisch rapport belicht de belangrijkste ontwerpbeslissingen die de prestaties van het middelgrote diffusiemodel verbeteren. Empirisch maken we twee observaties: (1) Seaweed-7B bereikt prestaties die vergelijkbaar zijn met, of zelfs beter dan, grotere modellen die getraind zijn met aanzienlijk meer GPU-bronnen, en (2) ons model, dat een sterke generalisatiecapaciteit vertoont, kan effectief worden aangepast voor een breed scala aan downstream toepassingen, hetzij door lichtgewicht fine-tuning of door voortgezette training. Zie de projectpagina op https://seaweed.video/