IDEAW: Robustes neuronales Audio-Wasserzeichen mit invertierbarer Dual-Einbettung
IDEAW: Robust Neural Audio Watermarking with Invertible Dual-Embedding
September 29, 2024
Autoren: Pengcheng Li, Xulong Zhang, Jing Xiao, Jianzong Wang
cs.AI
Zusammenfassung
Die Audio-Watermarking-Technik bettet Nachrichten in Audio ein und extrahiert Nachrichten präzise aus dem Wasserzeichen-Audio. Traditionelle Methoden entwickeln Algorithmen basierend auf Expertenwissen, um Wasserzeichen in den Zeitbereich oder Transformationsbereich von Signalen einzubetten. Mit der Entwicklung von tiefen neuronalen Netzwerken ist das auf Deep Learning basierende neuronale Audio-Watermarking entstanden. Im Vergleich zu traditionellen Algorithmen erzielt das neuronale Audio-Watermarking eine bessere Robustheit, indem es verschiedene Angriffe während des Trainings berücksichtigt. Allerdings leiden aktuelle neuronale Watermarking-Methoden unter geringer Kapazität und unbefriedigender Unwahrnehmbarkeit. Darüber hinaus wurde das Problem der Wasserzeichenlokalisierung, das beim neuronalen Audio-Watermarking besonders wichtig ist und noch ausgeprägter ist, nicht ausreichend untersucht. In diesem Artikel entwerfen wir ein Dual-Einbettungs-Watermarking-Modell für effiziente Lokalisierung. Wir berücksichtigen auch die Auswirkung der Angriffsschicht auf das invertierbare neuronale Netzwerk im Robustheitstraining, um das Modell zu verbessern und sowohl seine Angemessenheit als auch Stabilität zu erhöhen. Experimente zeigen, dass das vorgeschlagene Modell, IDEAW, im Vergleich zu bestehenden Methoden verschiedenen Angriffen standhalten kann und eine höhere Kapazität sowie eine effizientere Lokalisierungsfähigkeit aufweist.
English
The audio watermarking technique embeds messages into audio and accurately
extracts messages from the watermarked audio. Traditional methods develop
algorithms based on expert experience to embed watermarks into the time-domain
or transform-domain of signals. With the development of deep neural networks,
deep learning-based neural audio watermarking has emerged. Compared to
traditional algorithms, neural audio watermarking achieves better robustness by
considering various attacks during training. However, current neural
watermarking methods suffer from low capacity and unsatisfactory
imperceptibility. Additionally, the issue of watermark locating, which is
extremely important and even more pronounced in neural audio watermarking, has
not been adequately studied. In this paper, we design a dual-embedding
watermarking model for efficient locating. We also consider the impact of the
attack layer on the invertible neural network in robustness training, improving
the model to enhance both its reasonableness and stability. Experiments show
that the proposed model, IDEAW, can withstand various attacks with higher
capacity and more efficient locating ability compared to existing methods.Summary
AI-Generated Summary