다중 비트 이미지 워터마킹을 위한 ADD
ADD for Multi-Bit Image Watermarking
April 13, 2026
저자: An Luo, Jie Ding
cs.AI
초록
생성 모델이 고해상도 이미지를 빠르게 생성할 수 있게 되면서 허위 정보와 진위 여부에 대한 사회적 우려가 높아지고 있습니다. 다중 비트 이미지 워터마킹은 이러한 문제에 대한 유망한 해결책으로, 다중 비트 메시지를 이미지에 삽입하여 검증자가 나중에 해당 이미지가 생성된 것인지 감지하고 삽입된 메시지를 디코딩하여 출처를 추가로 식별할 수 있게 합니다. 기존 방법들은 용량, 일반적인 이미지 왜곡에 대한 견고성, 그리고 이론적 근거 측면에서 종종 부족함을 보입니다. 이러한 한계를 해결하기 위해 우리는 두 단계로 구성된 다중 비트 이미지 워터마킹 방법인 ADD(Add, Dot, Decode)를 제안합니다. 첫 번째 단계는 다중 비트 메시지와 선형 결합되어 이미지에 더해질 워터마크를 학습하는 것이고, 두 번째 단계는 워터마크가 삽입된 이미지와 학습된 워터마크 간의 내적을 통해 디코딩을 수행하는 것입니다. 표준 MS-COCO 벤치마크에서 우리는 48비트 워터마킹이라는 까다로운 과제에 대해 ADD가 100%의 디코딩 정확도를 달성하며, 다양한 이미지 왜곡 조건에서 성능 저하가 최대 2%에 그쳐 최신 방법들의 평균 14% 성능 저하보다 현저히 작음을 입증했습니다. 또한 ADD는 기존 가장 빠른 방법 대비 워터마크 삽입 속도는 2배, 디코딩 속도는 7.4배 향상되는 상당한 계산 이득을 달성했습니다. 우리는 더 나아가 학습된 워터마크와 해당 디코딩 규칙이 효과적인 이유를 설명하는 이론적 분석을 제공합니다.
English
As generative models enable rapid creation of high-fidelity images, societal concerns about misinformation and authenticity have intensified. A promising remedy is multi-bit image watermarking, which embeds a multi-bit message into an image so that a verifier can later detect whether the image is generated by someone and further identify the source by decoding the embedded message. Existing approaches often fall short in capacity, resilience to common image distortions, and theoretical justification. To address these limitations, we propose ADD (Add, Dot, Decode), a multi-bit image watermarking method with two stages: learning a watermark to be linearly combined with the multi-bit message and added to the image, and decoding through inner products between the watermarked image and the learned watermark. On the standard MS-COCO benchmark, we demonstrate that for the challenging task of 48-bit watermarking, ADD achieves 100\% decoding accuracy, with performance dropping by at most 2\% under a wide range of image distortions, substantially smaller than the 14\% average drop of state-of-the-art methods. In addition, ADD achieves substantial computational gains, with 2-fold faster embedding and 7.4-fold faster decoding than the fastest existing method. We further provide a theoretical analysis explaining why the learned watermark and the corresponding decoding rule are effective.