Peccavi: Visuele Parafraseer Aanval Veilige en Vervormingsvrije Afbeelding Watermerktechniek voor AI-gegenereerde Afbeeldingen
Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images
June 28, 2025
Auteurs: Shreyas Dixit, Ashhar Aziz, Shashwat Bajpai, Vasu Sharma, Aman Chadha, Vinija Jain, Amitava Das
cs.AI
Samenvatting
Een rapport van de Europese Unie's wetshandhavingsagentschap voorspelt dat tegen 2026 tot 90 procent van de online inhoud synthetisch gegenereerd zou kunnen zijn, wat zorgen oproept bij beleidsmakers. Zij waarschuwden dat "Generatieve AI een krachtige versterker kan zijn voor politieke desinformatie. Het gecombineerde effect van generatieve tekst, afbeeldingen, video's en audio kan de invloed van elke afzonderlijke modaliteit overtreffen." Als reactie hierop verplicht de Californische wet AB 3211 het watermerken van AI-gegenereerde afbeeldingen, video's en audio. Er blijven echter zorgen bestaan over de kwetsbaarheid van onzichtbare watermerktechnieken voor manipulatie en de mogelijkheid dat kwaadwillende actoren deze volledig omzeilen. Generatieve AI-gestuurde aanvallen om watermerken te verwijderen, met name de nieuw geïntroduceerde visuele parafrase-aanval, hebben aangetoond dat ze watermerken volledig kunnen verwijderen, wat resulteert in een parafrase van de originele afbeelding. Dit artikel introduceert PECCAVI, de eerste visuele parafrase-aanval-veilige en vervormingsvrije afbeelding-watermerktechniek. Bij visuele parafrase-aanvallen wordt een afbeelding aangepast terwijl de kernsemantische gebieden, zogenaamde Non-Melting Points (NMP's), behouden blijven. PECCAVI plaatst watermerken strategisch binnen deze NMP's en maakt gebruik van watermerken in het frequentiedomein met meerdere kanalen. Het incorporeert ook ruw branden om pogingen tot reverse-engineering te counteren die gericht zijn op het lokaliseren van NMP's om het ingebedde watermerk te verstoren, waardoor de duurzaamheid wordt vergroot. PECCAVI is model-agnostisch. Alle relevante bronnen en codes zullen openbaar worden gemaakt.
English
A report by the European Union Law Enforcement Agency predicts that by 2026,
up to 90 percent of online content could be synthetically generated, raising
concerns among policymakers, who cautioned that "Generative AI could act as a
force multiplier for political disinformation. The combined effect of
generative text, images, videos, and audio may surpass the influence of any
single modality." In response, California's Bill AB 3211 mandates the
watermarking of AI-generated images, videos, and audio. However, concerns
remain regarding the vulnerability of invisible watermarking techniques to
tampering and the potential for malicious actors to bypass them entirely.
Generative AI-powered de-watermarking attacks, especially the newly introduced
visual paraphrase attack, have shown an ability to fully remove watermarks,
resulting in a paraphrase of the original image. This paper introduces PECCAVI,
the first visual paraphrase attack-safe and distortion-free image watermarking
technique. In visual paraphrase attacks, an image is altered while preserving
its core semantic regions, termed Non-Melting Points (NMPs). PECCAVI
strategically embeds watermarks within these NMPs and employs multi-channel
frequency domain watermarking. It also incorporates noisy burnishing to counter
reverse-engineering efforts aimed at locating NMPs to disrupt the embedded
watermark, thereby enhancing durability. PECCAVI is model-agnostic. All
relevant resources and codes will be open-sourced.