ChatPaper.aiChatPaper

IDEAW : Marquage robuste de l'audio par watermarking neuronal avec double incorporation inversible

IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding

September 29, 2024
Auteurs: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI

Résumé

La technique de watermarking audio incorpore des messages dans l'audio et extrait avec précision des messages de l'audio watermarké. Les méthodes traditionnelles développent des algorithmes basés sur l'expérience d'experts pour incorporer des watermarks dans le domaine temporel ou le domaine de transformation des signaux. Avec le développement des réseaux neuronaux profonds, le watermarking audio neuronal basé sur l'apprentissage profond a émergé. Comparé aux algorithmes traditionnels, le watermarking audio neuronal atteint une meilleure robustesse en considérant diverses attaques lors de l'entraînement. Cependant, les méthodes actuelles de watermarking neuronal souffrent d'une faible capacité et d'une imperceptibilité insatisfaisante. De plus, la question de la localisation du watermark, qui est extrêmement importante et encore plus prononcée dans le watermarking audio neuronal, n'a pas été étudiée de manière adéquate. Dans cet article, nous concevons un modèle de watermarking à double incorporation pour une localisation efficace. Nous considérons également l'impact de la couche d'attaque sur le réseau neuronal inversible dans l'entraînement à la robustesse, améliorant le modèle pour renforcer à la fois sa cohérence et sa stabilité. Les expériences montrent que le modèle proposé, IDEAW, peut résister à diverses attaques avec une capacité plus élevée et une capacité de localisation plus efficace par rapport aux méthodes existantes.
English
The audio watermarking technique embeds messages into audio and accurately extracts messages from the watermarked audio. Traditional methods develop algorithms based on expert experience to embed watermarks into the time-domain or transform-domain of signals. With the development of deep neural networks, deep learning-based neural audio watermarking has emerged. Compared to traditional algorithms, neural audio watermarking achieves better robustness by considering various attacks during training. However, current neural watermarking methods suffer from low capacity and unsatisfactory imperceptibility. Additionally, the issue of watermark locating, which is extremely important and even more pronounced in neural audio watermarking, has not been adequately studied. In this paper, we design a dual-embedding watermarking model for efficient locating. We also consider the impact of the attack layer on the invertible neural network in robustness training, improving the model to enhance both its reasonableness and stability. Experiments show that the proposed model, IDEAW, can withstand various attacks with higher capacity and more efficient locating ability compared to existing methods.

Summary

AI-Generated Summary

PDF22November 13, 2024