ChatPaper.aiChatPaper

IDEAW: Watermarking Audio Neurale Robusto con Doppia Incorporazione Invertibile

IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding

September 29, 2024
Autori: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI

Abstract

La tecnica di watermarking audio incorpora messaggi nell'audio ed estrae con precisione i messaggi dall'audio con watermark. I metodi tradizionali sviluppano algoritmi basati sull'esperienza degli esperti per incorporare watermark nel dominio temporale o nel dominio di trasformazione dei segnali. Con lo sviluppo delle reti neurali profonde, è emerso il watermarking audio neurale basato sull'apprendimento profondo. Rispetto agli algoritmi tradizionali, il watermarking audio neurale raggiunge una maggiore robustezza considerando vari attacchi durante l'addestramento. Tuttavia, i metodi attuali di watermarking neurale soffrono di bassa capacità e impercettibilità insoddisfacente. Inoltre, la questione del posizionamento del watermark, estremamente importante e ancora più evidente nel watermarking audio neurale, non è stata studiata in modo adeguato. In questo articolo, progettiamo un modello di watermarking a doppia incorporazione per un posizionamento efficiente. Consideriamo anche l'impatto dello strato di attacco sulla rete neurale invertibile nell'addestramento alla robustezza, migliorando il modello per potenziare sia la sua coerenza che la sua stabilità. Gli esperimenti mostrano che il modello proposto, IDEAW, può resistere a vari attacchi con maggiore capacità e capacità di posizionamento più efficiente rispetto ai metodi esistenti.
English
The audio watermarking technique embeds messages into audio and accurately extracts messages from the watermarked audio. Traditional methods develop algorithms based on expert experience to embed watermarks into the time-domain or transform-domain of signals. With the development of deep neural networks, deep learning-based neural audio watermarking has emerged. Compared to traditional algorithms, neural audio watermarking achieves better robustness by considering various attacks during training. However, current neural watermarking methods suffer from low capacity and unsatisfactory imperceptibility. Additionally, the issue of watermark locating, which is extremely important and even more pronounced in neural audio watermarking, has not been adequately studied. In this paper, we design a dual-embedding watermarking model for efficient locating. We also consider the impact of the attack layer on the invertible neural network in robustness training, improving the model to enhance both its reasonableness and stability. Experiments show that the proposed model, IDEAW, can withstand various attacks with higher capacity and more efficient locating ability compared to existing methods.
PDF22November 13, 2024