ChatPaper.aiChatPaper

Peccavi: AI 생성 이미지를 위한 시각적 패러프레이즈 공격에 안전하고 왜곡 없는 이미지 워터마킹 기술

Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images

June 28, 2025
저자: Shreyas Dixit, Ashhar Aziz, Shashwat Bajpai, Vasu Sharma, Aman Chadha, Vinija Jain, Amitava Das
cs.AI

초록

유럽연합 법집행기구의 보고서에 따르면, 2026년까지 온라인 콘텐츠의 최대 90%가 합성적으로 생성될 것으로 예측되며, 이는 정책 결정자들 사이에서 우려를 불러일으키고 있습니다. 이들은 "생성형 AI가 정치적 허위정보의 확산을 가속화할 수 있다"고 경고하며, "생성형 텍스트, 이미지, 비디오, 오디오의 결합된 효과는 단일 모달리티의 영향력을 넘어설 수 있다"고 지적했습니다. 이에 대응하여 캘리포니아의 AB 3211 법안은 AI 생성 이미지, 비디오, 오디오에 워터마크를 의무화하고 있습니다. 그러나 보이지 않는 워터마크 기술이 변조에 취약할 수 있으며, 악의적인 행위자가 이를 완전히 우회할 가능성에 대한 우려가 여전히 남아 있습니다. 특히 최근 도입된 시각적 패러프레이즈 공격을 포함한 생성형 AI 기반의 워터마크 제거 공격은 워터마크를 완전히 제거하고 원본 이미지를 패러프레이즈할 수 있는 능력을 보여주었습니다. 본 논문은 시각적 패러프레이즈 공격에 안전하고 왜곡 없는 이미지 워터마크 기술인 PECCAVI를 소개합니다. 시각적 패러프레이즈 공격에서 이미지는 핵심 의미 영역인 Non-Melting Points(NMPs)를 보존하면서 변경됩니다. PECCAVI는 이러한 NMPs 내에 워터마크를 전략적으로 삽입하고 다중 채널 주파수 영역 워터마킹을 사용합니다. 또한, 노이즈 버니싱을 도입하여 NMPs를 찾아내어 내장된 워터마크를 방해하려는 역공학 시도를 방지함으로써 내구성을 강화합니다. PECCAVI는 모델에 독립적이며, 모든 관련 리소스와 코드는 오픈소스로 공개될 예정입니다.
English
A report by the European Union Law Enforcement Agency predicts that by 2026, up to 90 percent of online content could be synthetically generated, raising concerns among policymakers, who cautioned that "Generative AI could act as a force multiplier for political disinformation. The combined effect of generative text, images, videos, and audio may surpass the influence of any single modality." In response, California's Bill AB 3211 mandates the watermarking of AI-generated images, videos, and audio. However, concerns remain regarding the vulnerability of invisible watermarking techniques to tampering and the potential for malicious actors to bypass them entirely. Generative AI-powered de-watermarking attacks, especially the newly introduced visual paraphrase attack, have shown an ability to fully remove watermarks, resulting in a paraphrase of the original image. This paper introduces PECCAVI, the first visual paraphrase attack-safe and distortion-free image watermarking technique. In visual paraphrase attacks, an image is altered while preserving its core semantic regions, termed Non-Melting Points (NMPs). PECCAVI strategically embeds watermarks within these NMPs and employs multi-channel frequency domain watermarking. It also incorporates noisy burnishing to counter reverse-engineering efforts aimed at locating NMPs to disrupt the embedded watermark, thereby enhancing durability. PECCAVI is model-agnostic. All relevant resources and codes will be open-sourced.
PDF41July 2, 2025