Marcatura d'Acqua Senza Addestramento per la Generazione Autoregressiva di Immagini
Training-Free Watermarking for Autoregressive Image Generation
May 20, 2025
Autori: Yu Tong, Zihao Pan, Shuai Yang, Kaiyang Zhou
cs.AI
Abstract
La filigrana invisibile delle immagini può proteggere la proprietà delle immagini e prevenire l'uso malevolo dei modelli generativi visivi. Tuttavia, i metodi esistenti di filigrana generativa sono principalmente progettati per i modelli di diffusione, mentre la filigrana per i modelli di generazione di immagini autoregressivi rimane largamente inesplorata. Proponiamo IndexMark, un framework di filigrana senza addestramento per i modelli di generazione di immagini autoregressivi. IndexMark è ispirato dalla proprietà di ridondanza del codebook: sostituire gli indici generati autoregressivamente con indici simili produce differenze visive trascurabili. Il componente principale di IndexMark è un metodo semplice ma efficace di abbinamento e sostituzione, che seleziona attentamente i token di filigrana dal codebook in base alla similarità dei token e promuove l'uso dei token di filigrana attraverso la sostituzione dei token, incorporando così la filigrana senza influenzare la qualità dell'immagine. La verifica della filigrana viene ottenuta calcolando la proporzione di token di filigrana nelle immagini generate, con una precisione ulteriormente migliorata da un Index Encoder. Inoltre, introduciamo uno schema di validazione ausiliario per aumentare la robustezza contro gli attacchi di ritaglio. Gli esperimenti dimostrano che IndexMark raggiunge prestazioni all'avanguardia in termini di qualità dell'immagine e accuratezza della verifica, e mostra robustezza contro varie perturbazioni, inclusi ritaglio, rumori, sfocatura gaussiana, cancellazione casuale, variazione di colore e compressione JPEG.
English
Invisible image watermarking can protect image ownership and prevent
malicious misuse of visual generative models. However, existing generative
watermarking methods are mainly designed for diffusion models while
watermarking for autoregressive image generation models remains largely
underexplored. We propose IndexMark, a training-free watermarking framework for
autoregressive image generation models. IndexMark is inspired by the redundancy
property of the codebook: replacing autoregressively generated indices with
similar indices produces negligible visual differences. The core component in
IndexMark is a simple yet effective match-then-replace method, which carefully
selects watermark tokens from the codebook based on token similarity, and
promotes the use of watermark tokens through token replacement, thereby
embedding the watermark without affecting the image quality. Watermark
verification is achieved by calculating the proportion of watermark tokens in
generated images, with precision further improved by an Index Encoder.
Furthermore, we introduce an auxiliary validation scheme to enhance robustness
against cropping attacks. Experiments demonstrate that IndexMark achieves
state-of-the-art performance in terms of image quality and verification
accuracy, and exhibits robustness against various perturbations, including
cropping, noises, Gaussian blur, random erasing, color jittering, and JPEG
compression.