Verborgen in het Lawaai: Robuuste Watermerktechniek in Twee Stappen voor Afbeeldingen
Hidden in the Noise: Two-Stage Robust Watermarking for Images
December 5, 2024
Auteurs: Kasra Arabi, Benjamin Feuer, R. Teal Witter, Chinmay Hegde, Niv Cohen
cs.AI
Samenvatting
Naarmate de kwaliteit van beeldgeneratoren blijft verbeteren, worden deepfakes een onderwerp van aanzienlijk maatschappelijk debat. Beeldwatermerken stellen verantwoordelijke modelbezitters in staat om hun door AI gegenereerde inhoud te detecteren en te labelen, wat de schade kan beperken. Toch blijven de huidige state-of-the-art methoden voor beeldwatermerken kwetsbaar voor vervalsing en verwijderingsaanvallen. Deze kwetsbaarheid treedt deels op doordat watermerken de distributie van gegenereerde beelden verstoren en onbedoeld informatie onthullen over de watermerktechnieken.
In dit werk demonstreren we eerst een methode voor beeldwatermerken zonder vervorming, gebaseerd op het oorspronkelijke ruis van een diffusiemodel. Het detecteren van het watermerk vereist echter het vergelijken van de oorspronkelijke ruis die gereconstrueerd is voor een afbeelding met alle eerder gebruikte oorspronkelijke ruis. Om deze problemen te beperken, stellen we een tweefasen-watermerkframework voor voor efficiënte detectie. Tijdens de generatie verrijken we de oorspronkelijke ruis met gegenereerde Fourier-patronen om informatie in te sluiten over de groep oorspronkelijke ruis die we hebben gebruikt. Voor de detectie halen we (i) de relevante groep ruis op en (ii) zoeken binnen de gegeven groep naar een oorspronkelijke ruis die overeenkomt met onze afbeelding. Deze watermerkaanpak bereikt state-of-the-art robuustheid tegen vervalsing en verwijdering tegen een groot aantal aanvallen.
English
As the quality of image generators continues to improve, deepfakes become a
topic of considerable societal debate. Image watermarking allows responsible
model owners to detect and label their AI-generated content, which can mitigate
the harm. Yet, current state-of-the-art methods in image watermarking remain
vulnerable to forgery and removal attacks. This vulnerability occurs in part
because watermarks distort the distribution of generated images,
unintentionally revealing information about the watermarking techniques.
In this work, we first demonstrate a distortion-free watermarking method for
images, based on a diffusion model's initial noise. However, detecting the
watermark requires comparing the initial noise reconstructed for an image to
all previously used initial noises. To mitigate these issues, we propose a
two-stage watermarking framework for efficient detection. During generation, we
augment the initial noise with generated Fourier patterns to embed information
about the group of initial noises we used. For detection, we (i) retrieve the
relevant group of noises, and (ii) search within the given group for an initial
noise that might match our image. This watermarking approach achieves
state-of-the-art robustness to forgery and removal against a large battery of
attacks.