ChatPaper.aiChatPaper

Peccavi: Visuelle Paraphrasenangriffssichere und verzerrungsfreie Bildwasserzeichen-Technik für KI-generierte Bilder

Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images

June 28, 2025
Autoren: Shreyas Dixit, Ashhar Aziz, Shashwat Bajpai, Vasu Sharma, Aman Chadha, Vinija Jain, Amitava Das
cs.AI

Zusammenfassung

Ein Bericht der Europäischen Union für Strafverfolgungsbehörden prognostiziert, dass bis 2026 bis zu 90 Prozent der Online-Inhalte synthetisch generiert sein könnten. Dies hat Bedenken unter politischen Entscheidungsträgern geweckt, die warnten: „Generative KI könnte als Kraftmultiplikator für politische Desinformation wirken. Die kombinierte Wirkung von generativem Text, Bildern, Videos und Audio könnte den Einfluss jeder einzelnen Modalität übertreffen.“ Als Reaktion darauf schreibt das kalifornische Gesetz AB 3211 die Kennzeichnung von KI-generierten Bildern, Videos und Audio vor. Es bestehen jedoch weiterhin Bedenken hinsichtlich der Anfälligkeit unsichtbarer Wasserzeichen-Techniken für Manipulationen und der Möglichkeit, dass böswillige Akteure sie vollständig umgehen könnten. Generative KI-gestützte Angriffe zur Entfernung von Wasserzeichen, insbesondere der neu eingeführte visuelle Paraphrasierungsangriff, haben gezeigt, dass sie Wasserzeichen vollständig entfernen können, was zu einer Paraphrasierung des Originalbildes führt. Dieses Papier stellt PECCAVI vor, die erste visuelle Paraphrasierungsangriff-sichere und verzerrungsfreie Bildwasserzeichen-Technik. Bei visuellen Paraphrasierungsangriffen wird ein Bild verändert, während seine zentralen semantischen Bereiche, sogenannte Non-Melting Points (NMPs), erhalten bleiben. PECCAVI bettet Wasserzeichen strategisch in diesen NMPs ein und verwendet eine Mehrkanal-Frequenzbereichs-Wasserzeichen-Technik. Es integriert zudem ein rauschendes Polierverfahren, um Reverse-Engineering-Bemühungen zu begegnen, die darauf abzielen, NMPs zu lokalisieren und das eingebettete Wasserzeichen zu stören, wodurch die Haltbarkeit verbessert wird. PECCAVI ist modellunabhängig. Alle relevanten Ressourcen und Codes werden quelloffen zur Verfügung gestellt.
English
A report by the European Union Law Enforcement Agency predicts that by 2026, up to 90 percent of online content could be synthetically generated, raising concerns among policymakers, who cautioned that "Generative AI could act as a force multiplier for political disinformation. The combined effect of generative text, images, videos, and audio may surpass the influence of any single modality." In response, California's Bill AB 3211 mandates the watermarking of AI-generated images, videos, and audio. However, concerns remain regarding the vulnerability of invisible watermarking techniques to tampering and the potential for malicious actors to bypass them entirely. Generative AI-powered de-watermarking attacks, especially the newly introduced visual paraphrase attack, have shown an ability to fully remove watermarks, resulting in a paraphrase of the original image. This paper introduces PECCAVI, the first visual paraphrase attack-safe and distortion-free image watermarking technique. In visual paraphrase attacks, an image is altered while preserving its core semantic regions, termed Non-Melting Points (NMPs). PECCAVI strategically embeds watermarks within these NMPs and employs multi-channel frequency domain watermarking. It also incorporates noisy burnishing to counter reverse-engineering efforts aimed at locating NMPs to disrupt the embedded watermark, thereby enhancing durability. PECCAVI is model-agnostic. All relevant resources and codes will be open-sourced.
PDF41July 2, 2025