ChatPaper.aiChatPaper

SonicMaster: 制御可能なオールインワン音楽修復およびマスタリングに向けて

SonicMaster: Towards Controllable All-in-One Music Restoration and Mastering

August 5, 2025
著者: Jan Melechovsky, Ambuj Mehrish, Dorien Herremans
cs.AI

要旨

音楽録音は、特に専門的な設備や知識がない非専門的な環境で作成される場合、過剰なリバーブ、歪み、クリッピング、トーンバランスの崩れ、狭まったステレオイメージといった音質の問題に悩まされることが多い。これらの問題は通常、個別の専門ツールや手動調整を用いて修正される。本論文では、テキストベースの制御により幅広い音響アーティファクトに対処する、音楽修復およびマスタリングのための初の統合生成モデルであるSonicMasterを紹介する。SonicMasterは、自然言語の指示に基づいて特定のエンハンスメントを適用するか、一般的な修復のために自動モードで動作することができる。このモデルを訓練するために、5つのエンハンスメントグループ(イコライゼーション、ダイナミクス、リバーブ、振幅、ステレオ)に属する19の劣化関数を用いて一般的な劣化タイプをシミュレートし、劣化したトラックと高品質なトラックのペアからなる大規模なデータセットであるSonicMasterデータセットを構築した。我々のアプローチは、フローマッチング生成訓練パラダイムを活用し、テキストプロンプトに導かれて劣化した入力をクリーンでマスタリングされたバージョンにマッピングする音響変換を学習する。客観的な音質メトリクスは、SonicMasterが全てのアーティファクトカテゴリーにおいて音質を大幅に改善することを示している。さらに、主観的なリスニングテストでは、リスナーがSonicMasterのエンハンスメントされた出力を元の劣化した音声よりも好むことが確認され、我々の統合アプローチの有効性が強調されている。
English
Music recordings often suffer from audio quality issues such as excessive reverberation, distortion, clipping, tonal imbalances, and a narrowed stereo image, especially when created in non-professional settings without specialized equipment or expertise. These problems are typically corrected using separate specialized tools and manual adjustments. In this paper, we introduce SonicMaster, the first unified generative model for music restoration and mastering that addresses a broad spectrum of audio artifacts with text-based control. SonicMaster is conditioned on natural language instructions to apply targeted enhancements, or can operate in an automatic mode for general restoration. To train this model, we construct the SonicMaster dataset, a large dataset of paired degraded and high-quality tracks by simulating common degradation types with nineteen degradation functions belonging to five enhancements groups: equalization, dynamics, reverb, amplitude, and stereo. Our approach leverages a flow-matching generative training paradigm to learn an audio transformation that maps degraded inputs to their cleaned, mastered versions guided by text prompts. Objective audio quality metrics demonstrate that SonicMaster significantly improves sound quality across all artifact categories. Furthermore, subjective listening tests confirm that listeners prefer SonicMaster's enhanced outputs over the original degraded audio, highlighting the effectiveness of our unified approach.
PDF12August 7, 2025