IDEAW: Robuuste neurale audiowatermerking met omkeerbare dubbele insluiting
IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding
September 29, 2024
Auteurs: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI
Samenvatting
De audiowatermerktechniek embedt berichten in audio en haalt berichten nauwkeurig uit de watergemerkte audio. Traditionele methoden ontwikkelen algoritmes op basis van expertervaring om watermerken in het tijdsdomein of transformatiedomein van signalen in te bedden. Met de opkomst van diepe neurale netwerken is op diepe leren gebaseerde neurale audiowatermerking ontstaan. In vergelijking met traditionele algoritmes bereikt neurale audiowatermerking een betere robuustheid door verschillende aanvallen tijdens training te overwegen. Echter, huidige neurale watermerkmethoden kampen met een lage capaciteit en onbevredigende onopvallendheid. Bovendien is het probleem van watermerklokalisatie, dat uiterst belangrijk is en nog meer uitgesproken in neurale audiowatermerking, niet voldoende bestudeerd. In dit artikel ontwerpen we een dubbele-embeddingswatermerkmodel voor efficiënte lokalisatie. We houden ook rekening met de impact van de aanvalslaag op het omkeerbare neurale netwerk in robuuste training, waardoor het model wordt verbeterd om zowel zijn redelijkheid als stabiliteit te versterken. Experimenten tonen aan dat het voorgestelde model, IDEAW, verschillende aanvallen kan weerstaan met een hogere capaciteit en een efficiëntere lokalisatievermogen in vergelijking met bestaande methoden.
English
The audio watermarking technique embeds messages into audio and accurately
extracts messages from the watermarked audio. Traditional methods develop
algorithms based on expert experience to embed watermarks into the time-domain
or transform-domain of signals. With the development of deep neural networks,
deep learning-based neural audio watermarking has emerged. Compared to
traditional algorithms, neural audio watermarking achieves better robustness by
considering various attacks during training. However, current neural
watermarking methods suffer from low capacity and unsatisfactory
imperceptibility. Additionally, the issue of watermark locating, which is
extremely important and even more pronounced in neural audio watermarking, has
not been adequately studied. In this paper, we design a dual-embedding
watermarking model for efficient locating. We also consider the impact of the
attack layer on the invertible neural network in robustness training, improving
the model to enhance both its reasonableness and stability. Experiments show
that the proposed model, IDEAW, can withstand various attacks with higher
capacity and more efficient locating ability compared to existing methods.Summary
AI-Generated Summary