IDEAW: Marcado de agua de audio neural robusto con incrustación dual invertible.
IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding
September 29, 2024
Autores: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI
Resumen
La técnica de marca de agua de audio incrusta mensajes en el audio y extrae con precisión mensajes del audio marcado. Los métodos tradicionales desarrollan algoritmos basados en la experiencia de expertos para incrustar marcas de agua en el dominio temporal o de transformación de las señales. Con el desarrollo de redes neuronales profundas, ha surgido la marca de agua de audio neural basada en aprendizaje profundo. En comparación con los algoritmos tradicionales, la marca de agua de audio neural logra una mejor robustez al considerar varios ataques durante el entrenamiento. Sin embargo, los métodos actuales de marca de agua neural sufren de baja capacidad e imperceptibilidad insatisfactoria. Además, el problema de la localización de la marca de agua, que es extremadamente importante y aún más pronunciado en la marca de agua de audio neural, no ha sido estudiado adecuadamente. En este documento, diseñamos un modelo de marca de agua de doble incrustación para una localización eficiente. También consideramos el impacto de la capa de ataque en la red neuronal invertible en el entrenamiento de robustez, mejorando el modelo para mejorar tanto su razonabilidad como su estabilidad. Los experimentos muestran que el modelo propuesto, IDEAW, puede resistir varios ataques con una mayor capacidad y una capacidad de localización más eficiente en comparación con los métodos existentes.
English
The audio watermarking technique embeds messages into audio and accurately
extracts messages from the watermarked audio. Traditional methods develop
algorithms based on expert experience to embed watermarks into the time-domain
or transform-domain of signals. With the development of deep neural networks,
deep learning-based neural audio watermarking has emerged. Compared to
traditional algorithms, neural audio watermarking achieves better robustness by
considering various attacks during training. However, current neural
watermarking methods suffer from low capacity and unsatisfactory
imperceptibility. Additionally, the issue of watermark locating, which is
extremely important and even more pronounced in neural audio watermarking, has
not been adequately studied. In this paper, we design a dual-embedding
watermarking model for efficient locating. We also consider the impact of the
attack layer on the invertible neural network in robustness training, improving
the model to enhance both its reasonableness and stability. Experiments show
that the proposed model, IDEAW, can withstand various attacks with higher
capacity and more efficient locating ability compared to existing methods.Summary
AI-Generated Summary