Infilling simbolico di musica a lungo contesto personalizzabile con MIDI-RWKV
Personalizable Long-Context Symbolic Music Infilling with MIDI-RWKV
June 16, 2025
Autori: Christian Zhou-Zheng, Philippe Pasquier
cs.AI
Abstract
La ricerca esistente nella generazione automatica di musica si è concentrata principalmente su sistemi end-to-end che producono composizioni complete o continuazioni. Tuttavia, poiché la composizione musicale è tipicamente un processo iterativo, tali sistemi rendono difficile il coinvolgimento in un dialogo bidirezionale tra uomo e macchina, essenziale per la creatività assistita dal computer. In questo studio, affrontiamo il compito di infilling musicale simbolico personalizzabile, multi-traccia, a lungo contesto e controllabile per migliorare il processo di composizione assistita dal computer. Presentiamo MIDI-RWKV, un modello innovativo basato sull'architettura lineare RWKV-7, per abilitare una cocreazione musicale efficiente e coerente su dispositivi edge. Dimostriamo inoltre che MIDI-RWKV consente un metodo efficace di fine-tuning del suo stato iniziale per la personalizzazione in regime di campionamento molto ridotto. Valutiamo MIDI-RWKV e il suo tuning di stato su diverse metriche quantitative e qualitative, e rilasciamo i pesi del modello e il codice su https://github.com/christianazinn/MIDI-RWKV.
English
Existing work in automatic music generation has primarily focused on
end-to-end systems that produce complete compositions or continuations.
However, because musical composition is typically an iterative process, such
systems make it difficult to engage in the back-and-forth between human and
machine that is essential to computer-assisted creativity. In this study, we
address the task of personalizable, multi-track, long-context, and controllable
symbolic music infilling to enhance the process of computer-assisted
composition. We present MIDI-RWKV, a novel model based on the RWKV-7 linear
architecture, to enable efficient and coherent musical cocreation on edge
devices. We also demonstrate that MIDI-RWKV admits an effective method of
finetuning its initial state for personalization in the very-low-sample regime.
We evaluate MIDI-RWKV and its state tuning on several quantitative and
qualitative metrics, and release model weights and code at
https://github.com/christianazinn/MIDI-RWKV.