Скрытые в шуме: Двухэтапное устойчивое водяное штампование для изображений
Hidden in the Noise: Two-Stage Robust Watermarking for Images
December 5, 2024
Авторы: Kasra Arabi, Benjamin Feuer, R. Teal Witter, Chinmay Hegde, Niv Cohen
cs.AI
Аннотация
По мере улучшения качества генераторов изображений, deepfakes становятся предметом значительного общественного дебаты. Водяные знаки для изображений позволяют ответственным владельцам моделей обнаруживать и помечать свои контенты, созданные с использованием искусственного интеллекта, что может смягчить негативные последствия. Однако существующие передовые методы водяных знаков для изображений остаются уязвимыми к подделке и атакам на удаление. Эта уязвимость частично обусловлена тем, что водяные знаки искажают распределение созданных изображений, нечаянно раскрывая информацию о методах водяных знаков.
В данной работе мы в первую очередь демонстрируем метод водяных знаков для изображений без искажений, основанный на начальном шуме модели диффузии. Однако для обнаружения водяного знака требуется сравнение восстановленного начального шума для изображения со всеми ранее использованными начальными шумами. Для решения этих проблем мы предлагаем двухэтапную структуру водяных знаков для эффективного обнаружения. Во время генерации мы дополняем начальный шум сгенерированными Фурье-паттернами для встраивания информации о группе начальных шумов, которые мы использовали. Для обнаружения мы (i) извлекаем соответствующую группу шумов и (ii) ищем в данной группе начальный шум, который может соответствовать нашему изображению. Этот подход к водяным знакам обеспечивает передовую устойчивость к подделке и удалению от широкого спектра атак.
English
As the quality of image generators continues to improve, deepfakes become a
topic of considerable societal debate. Image watermarking allows responsible
model owners to detect and label their AI-generated content, which can mitigate
the harm. Yet, current state-of-the-art methods in image watermarking remain
vulnerable to forgery and removal attacks. This vulnerability occurs in part
because watermarks distort the distribution of generated images,
unintentionally revealing information about the watermarking techniques.
In this work, we first demonstrate a distortion-free watermarking method for
images, based on a diffusion model's initial noise. However, detecting the
watermark requires comparing the initial noise reconstructed for an image to
all previously used initial noises. To mitigate these issues, we propose a
two-stage watermarking framework for efficient detection. During generation, we
augment the initial noise with generated Fourier patterns to embed information
about the group of initial noises we used. For detection, we (i) retrieve the
relevant group of noises, and (ii) search within the given group for an initial
noise that might match our image. This watermarking approach achieves
state-of-the-art robustness to forgery and removal against a large battery of
attacks.Summary
AI-Generated Summary