Marca d'água sem treinamento para geração autoregressiva de imagens

Resumo

A marca d'água invisível em imagens pode proteger a propriedade de imagens e prevenir o uso malicioso de modelos generativos visuais. No entanto, os métodos existentes de marca d'água generativa são principalmente projetados para modelos de difusão, enquanto a marca d'água para modelos de geração de imagens autoregressivos permanece amplamente inexplorada. Propomos o IndexMark, uma estrutura de marca d'água sem necessidade de treinamento para modelos de geração de imagens autoregressivos. O IndexMark é inspirado pela propriedade de redundância do codebook: substituir índices gerados autoregressivamente por índices semelhantes produz diferenças visuais insignificantes. O componente central do IndexMark é um método simples, porém eficaz, de correspondência e substituição, que seleciona cuidadosamente tokens de marca d'água do codebook com base na similaridade de tokens e promove o uso de tokens de marca d'água por meio da substituição de tokens, incorporando assim a marca d'água sem afetar a qualidade da imagem. A verificação da marca d'água é realizada calculando a proporção de tokens de marca d'água nas imagens geradas, com a precisão aprimorada por um Index Encoder. Além disso, introduzimos um esquema de validação auxiliar para aumentar a robustez contra ataques de recorte. Experimentos demonstram que o IndexMark alcança desempenho de ponta em termos de qualidade de imagem e precisão de verificação, além de exibir robustez contra várias perturbações, incluindo recorte, ruídos, desfoque gaussiano, apagamento aleatório, variação de cor e compressão JPEG.

English

Invisible image watermarking can protect image ownership and prevent malicious misuse of visual generative models. However, existing generative watermarking methods are mainly designed for diffusion models while watermarking for autoregressive image generation models remains largely underexplored. We propose IndexMark, a training-free watermarking framework for autoregressive image generation models. IndexMark is inspired by the redundancy property of the codebook: replacing autoregressively generated indices with similar indices produces negligible visual differences. The core component in IndexMark is a simple yet effective match-then-replace method, which carefully selects watermark tokens from the codebook based on token similarity, and promotes the use of watermark tokens through token replacement, thereby embedding the watermark without affecting the image quality. Watermark verification is achieved by calculating the proportion of watermark tokens in generated images, with precision further improved by an Index Encoder. Furthermore, we introduce an auxiliary validation scheme to enhance robustness against cropping attacks. Experiments demonstrate that IndexMark achieves state-of-the-art performance in terms of image quality and verification accuracy, and exhibits robustness against various perturbations, including cropping, noises, Gaussian blur, random erasing, color jittering, and JPEG compression.

Marca d'água sem treinamento para geração autoregressiva de imagens

Training-Free Watermarking for Autoregressive Image Generation

Resumo

Support