ChatPaper.aiChatPaper

Infilling simbolico di musica a lungo contesto personalizzabile con MIDI-RWKV

Personalizable Long-Context Symbolic Music Infilling with MIDI-RWKV

June 16, 2025
Autori: Christian Zhou-Zheng, Philippe Pasquier
cs.AI

Abstract

La ricerca esistente nella generazione automatica di musica si è concentrata principalmente su sistemi end-to-end che producono composizioni complete o continuazioni. Tuttavia, poiché la composizione musicale è tipicamente un processo iterativo, tali sistemi rendono difficile il coinvolgimento in un dialogo bidirezionale tra uomo e macchina, essenziale per la creatività assistita dal computer. In questo studio, affrontiamo il compito di infilling musicale simbolico personalizzabile, multi-traccia, a lungo contesto e controllabile per migliorare il processo di composizione assistita dal computer. Presentiamo MIDI-RWKV, un modello innovativo basato sull'architettura lineare RWKV-7, per abilitare una cocreazione musicale efficiente e coerente su dispositivi edge. Dimostriamo inoltre che MIDI-RWKV consente un metodo efficace di fine-tuning del suo stato iniziale per la personalizzazione in regime di campionamento molto ridotto. Valutiamo MIDI-RWKV e il suo tuning di stato su diverse metriche quantitative e qualitative, e rilasciamo i pesi del modello e il codice su https://github.com/christianazinn/MIDI-RWKV.
English
Existing work in automatic music generation has primarily focused on end-to-end systems that produce complete compositions or continuations. However, because musical composition is typically an iterative process, such systems make it difficult to engage in the back-and-forth between human and machine that is essential to computer-assisted creativity. In this study, we address the task of personalizable, multi-track, long-context, and controllable symbolic music infilling to enhance the process of computer-assisted composition. We present MIDI-RWKV, a novel model based on the RWKV-7 linear architecture, to enable efficient and coherent musical cocreation on edge devices. We also demonstrate that MIDI-RWKV admits an effective method of finetuning its initial state for personalization in the very-low-sample regime. We evaluate MIDI-RWKV and its state tuning on several quantitative and qualitative metrics, and release model weights and code at https://github.com/christianazinn/MIDI-RWKV.
PDF12June 18, 2025