Seed-Music: Un quadro unificato per la generazione di musica di alta qualità e controllata

Abstract

Introduciamo Seed-Music, un insieme di sistemi di generazione musicale capaci di produrre musica di alta qualità con un controllo dettagliato dello stile. Il nostro framework unificato sfrutta sia la modellazione del linguaggio auto-regressiva che gli approcci di diffusione per supportare due flussi di lavoro chiave nella creazione musicale: generazione di musica controllata e editing in post-produzione. Per la generazione di musica controllata, il nostro sistema consente la generazione di musica vocale con controlli prestazionali da input multimodali, inclusi descrizioni di stile, riferimenti audio, partiture musicali e suggerimenti vocali. Per l'editing in post-produzione, offre strumenti interattivi per modificare testi e melodie vocali direttamente nell'audio generato. Incoraggiamo i lettori ad ascoltare esempi audio dimostrativi su https://team.doubao.com/seed-music.

English

We introduce Seed-Music, a suite of music generation systems capable of producing high-quality music with fine-grained style control. Our unified framework leverages both auto-regressive language modeling and diffusion approaches to support two key music creation workflows: controlled music generation and post-production editing. For controlled music generation, our system enables vocal music generation with performance controls from multi-modal inputs, including style descriptions, audio references, musical scores, and voice prompts. For post-production editing, it offers interactive tools for editing lyrics and vocal melodies directly in the generated audio. We encourage readers to listen to demo audio examples at https://team.doubao.com/seed-music .

Seed-Music: Un quadro unificato per la generazione di musica di alta qualità e controllata

Seed-Music: A Unified Framework for High Quality and Controlled Music Generation

Abstract

Support