Peccavi: Técnica de Marcado de Imágenes Segura y Libre de Distorsión para Ataques de Paráfrasis Visual en Imágenes Generadas por IA
Peccavi: Visual Paraphrase Attack Safe and Distortion Free Image Watermarking Technique for AI-Generated Images
June 28, 2025
Autores: Shreyas Dixit, Ashhar Aziz, Shashwat Bajpai, Vasu Sharma, Aman Chadha, Vinija Jain, Amitava Das
cs.AI
Resumen
Un informe de la Agencia de Aplicación de la Ley de la Unión Europea predice que, para 2026, hasta el 90 por ciento del contenido en línea podría estar generado sintéticamente, lo que ha generado preocupación entre los responsables políticos, quienes advirtieron que "la IA generativa podría actuar como un multiplicador de fuerza para la desinformación política. El efecto combinado del texto, las imágenes, los videos y el audio generativos podría superar la influencia de cualquier modalidad individual". En respuesta, el proyecto de ley AB 3211 de California exige la marca de agua en imágenes, videos y audio generados por IA. Sin embargo, persisten las preocupaciones sobre la vulnerabilidad de las técnicas de marca de agua invisible a la manipulación y la posibilidad de que actores maliciosos las eludan por completo. Los ataques de eliminación de marcas de agua impulsados por IA generativa, especialmente el recién introducido ataque de paráfrasis visual, han demostrado la capacidad de eliminar completamente las marcas de agua, lo que resulta en una paráfrasis de la imagen original. Este artículo presenta PECCAVI, la primera técnica de marca de agua en imágenes segura frente a ataques de paráfrasis visual y libre de distorsiones. En los ataques de paráfrasis visual, una imagen se altera preservando sus regiones semánticas centrales, denominadas Puntos No Fundentes (NMPs, por sus siglas en inglés). PECCAVI incrusta estratégicamente las marcas de agua dentro de estos NMPs y emplea marcas de agua en el dominio de frecuencia multicanal. También incorpora un bruñido ruidoso para contrarrestar los esfuerzos de ingeniería inversa destinados a localizar los NMPs y alterar la marca de agua incrustada, mejorando así su durabilidad. PECCAVI es independiente del modelo. Todos los recursos y códigos relevantes se publicarán como código abierto.
English
A report by the European Union Law Enforcement Agency predicts that by 2026,
up to 90 percent of online content could be synthetically generated, raising
concerns among policymakers, who cautioned that "Generative AI could act as a
force multiplier for political disinformation. The combined effect of
generative text, images, videos, and audio may surpass the influence of any
single modality." In response, California's Bill AB 3211 mandates the
watermarking of AI-generated images, videos, and audio. However, concerns
remain regarding the vulnerability of invisible watermarking techniques to
tampering and the potential for malicious actors to bypass them entirely.
Generative AI-powered de-watermarking attacks, especially the newly introduced
visual paraphrase attack, have shown an ability to fully remove watermarks,
resulting in a paraphrase of the original image. This paper introduces PECCAVI,
the first visual paraphrase attack-safe and distortion-free image watermarking
technique. In visual paraphrase attacks, an image is altered while preserving
its core semantic regions, termed Non-Melting Points (NMPs). PECCAVI
strategically embeds watermarks within these NMPs and employs multi-channel
frequency domain watermarking. It also incorporates noisy burnishing to counter
reverse-engineering efforts aimed at locating NMPs to disrupt the embedded
watermark, thereby enhancing durability. PECCAVI is model-agnostic. All
relevant resources and codes will be open-sourced.