ChatPaper.aiChatPaper

IDEAW: Marcação d'Água Neural de Áudio Robusta com Dupla Incorporação Invertível

IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding

September 29, 2024
Autores: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI

Resumo

A técnica de marca d'água de áudio incorpora mensagens em áudio e extrai com precisão mensagens do áudio marcado. Métodos tradicionais desenvolvem algoritmos com base na experiência de especialistas para incorporar marcas d'água no domínio do tempo ou domínio da transformada de sinais. Com o desenvolvimento de redes neurais profundas, surgiu a marca d'água de áudio neural baseada em aprendizado profundo. Em comparação com algoritmos tradicionais, a marca d'água de áudio neural alcança melhor robustez ao considerar vários ataques durante o treinamento. No entanto, os métodos atuais de marca d'água neural sofrem com baixa capacidade e imperceptibilidade insatisfatória. Além disso, a questão da localização da marca d'água, que é extremamente importante e ainda mais pronunciada na marca d'água de áudio neural, não foi adequadamente estudada. Neste artigo, projetamos um modelo de marca d'água de dupla incorporação para localização eficiente. Também consideramos o impacto da camada de ataque na rede neural invertível no treinamento de robustez, aprimorando o modelo para melhorar tanto sua razoabilidade quanto sua estabilidade. Experimentos mostram que o modelo proposto, IDEAW, pode resistir a vários ataques com maior capacidade e capacidade de localização mais eficiente em comparação com métodos existentes.
English
The audio watermarking technique embeds messages into audio and accurately extracts messages from the watermarked audio. Traditional methods develop algorithms based on expert experience to embed watermarks into the time-domain or transform-domain of signals. With the development of deep neural networks, deep learning-based neural audio watermarking has emerged. Compared to traditional algorithms, neural audio watermarking achieves better robustness by considering various attacks during training. However, current neural watermarking methods suffer from low capacity and unsatisfactory imperceptibility. Additionally, the issue of watermark locating, which is extremely important and even more pronounced in neural audio watermarking, has not been adequately studied. In this paper, we design a dual-embedding watermarking model for efficient locating. We also consider the impact of the attack layer on the invertible neural network in robustness training, improving the model to enhance both its reasonableness and stability. Experiments show that the proposed model, IDEAW, can withstand various attacks with higher capacity and more efficient locating ability compared to existing methods.

Summary

AI-Generated Summary

PDF22November 13, 2024