Seaweed-7B: Addestramento Economico di un Modello Fondamentale per la Generazione di VideoSeaweed-7B: Cost-Effective Training of Video Generation Foundation Model
Questo rapporto tecnico presenta una strategia economicamente efficiente per l'addestramento di un modello di base per la generazione di video. Introduciamo un modello di ricerca di medie dimensioni con circa 7 miliardi di parametri (7B), denominato Seaweed-7B, addestrato da zero utilizzando 665.000 ore di GPU H100. Nonostante sia stato addestrato con risorse computazionali moderate, Seaweed-7B dimostra prestazioni altamente competitive rispetto ai modelli contemporanei di generazione video di dimensioni molto più grandi. Le scelte progettuali sono particolarmente cruciali in un contesto con risorse limitate. Questo rapporto tecnico evidenzia le decisioni progettuali chiave che migliorano le prestazioni del modello di diffusione di medie dimensioni. Empiricamente, osserviamo due aspetti: (1) Seaweed-7B raggiunge prestazioni paragonabili o addirittura superiori a modelli più grandi addestrati con risorse GPU significativamente maggiori, e (2) il nostro modello, che mostra una forte capacità di generalizzazione, può essere efficacemente adattato a un'ampia gamma di applicazioni downstream attraverso un fine-tuning leggero o un addestramento continuo. Visita la pagina del progetto all'indirizzo https://seaweed.video/