ChatPaper.aiChatPaper

IDEAW: Надежное нейронное аудиоводяное жесть с инвертируемым двойным встраиванием.

IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding

September 29, 2024
Авторы: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI

Аннотация

Техника аудиоводяных знаков внедряет сообщения в аудио и точно извлекает сообщения из аудиоводяных знаков. Традиционные методы разрабатывают алгоритмы на основе опыта экспертов для встраивания водяных знаков во временной домен или преобразованный домен сигналов. С развитием глубоких нейронных сетей появилось нейросетевое аудиоводяное водяное знакование. По сравнению с традиционными алгоритмами, нейросетевое аудиоводяное водяное знакование достигает лучшей устойчивости, учитывая различные атаки во время обучения. Однако текущие методы нейросетевого водяного знакования страдают от низкой емкости и неудовлетворительной незаметности. Кроме того, проблема локализации водяного знака, которая является чрезвычайно важной и еще более заметной в нейросетевом аудиоводяном водяном знаковании, не была должным образом изучена. В данной статье мы разрабатываем модель двойного встраивания водяного знака для эффективной локализации. Мы также рассматриваем влияние слоя атаки на обратимую нейронную сеть в процессе обучения устойчивости, улучшая модель для усиления как ее обоснованности, так и стабильности. Эксперименты показывают, что предложенная модель, IDEAW, способна выдерживать различные атаки с более высокой емкостью и более эффективной способностью локализации по сравнению с существующими методами.
English
The audio watermarking technique embeds messages into audio and accurately extracts messages from the watermarked audio. Traditional methods develop algorithms based on expert experience to embed watermarks into the time-domain or transform-domain of signals. With the development of deep neural networks, deep learning-based neural audio watermarking has emerged. Compared to traditional algorithms, neural audio watermarking achieves better robustness by considering various attacks during training. However, current neural watermarking methods suffer from low capacity and unsatisfactory imperceptibility. Additionally, the issue of watermark locating, which is extremely important and even more pronounced in neural audio watermarking, has not been adequately studied. In this paper, we design a dual-embedding watermarking model for efficient locating. We also consider the impact of the attack layer on the invertible neural network in robustness training, improving the model to enhance both its reasonableness and stability. Experiments show that the proposed model, IDEAW, can withstand various attacks with higher capacity and more efficient locating ability compared to existing methods.

Summary

AI-Generated Summary

PDF22November 13, 2024