Watermark ad Anello degli Alberi: Impronte Digitali per Immagini di Diffusione Invisibili e Robuste

Abstract

La filigranatura degli output dei modelli generativi è una tecnica cruciale per tracciare i diritti d'autore e prevenire potenziali danni derivanti da contenuti generati dall'IA. In questo articolo, introduciamo una nuova tecnica chiamata Tree-Ring Watermarking che identifica in modo robusto gli output dei modelli di diffusione. A differenza dei metodi esistenti che apportano modifiche post-hoc alle immagini dopo il campionamento, il Tree-Ring Watermarking influenza sottilmente l'intero processo di campionamento, risultando in un'impronta digitale del modello invisibile all'occhio umano. La filigrana incorpora un pattern nel vettore di rumore iniziale utilizzato per il campionamento. Questi pattern sono strutturati nello spazio di Fourier in modo da essere invarianti a convoluzioni, ritagli, dilatazioni, ribaltamenti e rotazioni. Dopo la generazione dell'immagine, il segnale della filigrana viene rilevato invertendo il processo di diffusione per recuperare il vettore di rumore, che viene poi controllato per la presenza del segnale incorporato. Dimostriamo che questa tecnica può essere facilmente applicata a modelli di diffusione arbitrari, incluso il Stable Diffusion condizionato al testo, come plug-in con una perdita trascurabile in termini di FID. La nostra filigrana è semanticamente nascosta nello spazio dell'immagine ed è molto più robusta rispetto alle alternative di filigranatura attualmente implementate. Il codice è disponibile su github.com/YuxinWenRick/tree-ring-watermark.

English

Watermarking the outputs of generative models is a crucial technique for tracing copyright and preventing potential harm from AI-generated content. In this paper, we introduce a novel technique called Tree-Ring Watermarking that robustly fingerprints diffusion model outputs. Unlike existing methods that perform post-hoc modifications to images after sampling, Tree-Ring Watermarking subtly influences the entire sampling process, resulting in a model fingerprint that is invisible to humans. The watermark embeds a pattern into the initial noise vector used for sampling. These patterns are structured in Fourier space so that they are invariant to convolutions, crops, dilations, flips, and rotations. After image generation, the watermark signal is detected by inverting the diffusion process to retrieve the noise vector, which is then checked for the embedded signal. We demonstrate that this technique can be easily applied to arbitrary diffusion models, including text-conditioned Stable Diffusion, as a plug-in with negligible loss in FID. Our watermark is semantically hidden in the image space and is far more robust than watermarking alternatives that are currently deployed. Code is available at github.com/YuxinWenRick/tree-ring-watermark.

Watermark ad Anello degli Alberi: Impronte Digitali per Immagini di Diffusione Invisibili e Robuste

Tree-Ring Watermarks: Fingerprints for Diffusion Images that are Invisible and Robust

Abstract

Support