Los detectores de imágenes generadas por IA se basan excesivamente en artefactos globales: evidencia mediante intercambio de restauración

Resumen

El inpaint basado en aprendizaje profundo moderno permite una manipulación local realista de imágenes, lo que plantea desafíos críticos para una detección confiable. Sin embargo, observamos que los detectores actuales se basan principalmente en artefactos globales que aparecen como efectos secundarios del inpaint, en lugar de en el contenido sintetizado localmente. Demostramos que este comportamiento ocurre porque la reconstrucción basada en VAE induce un cambio espectral sutil pero generalizado en toda la imagen, incluidas las regiones no editadas. Para aislar este efecto, introducimos Inpainting Exchange (INP-X), una operación que restaura los píxeles originales fuera de la región editada mientras preserva todo el contenido sintetizado. Creamos un conjunto de datos de prueba de 90K que incluye imágenes reales, con inpaint e intercambiadas para evaluar este fenómeno. Bajo esta intervención, los detectores preentrenados de última generación, incluidos los comerciales, exhiben una caída drástica en la precisión (por ejemplo, del 91% al 55%), frecuentemente acercándose al nivel de azar. Proporcionamos un análisis teórico que vincula este comportamiento con la atenuación de altas frecuencias causada por los cuellos de botella de información de los VAE. Nuestros hallazgos resaltan la necesidad de una detección consciente del contenido. De hecho, el entrenamiento con nuestro conjunto de datos produce una mejor generalización y localización que el inpaint estándar. Nuestro conjunto de datos y código están disponibles públicamente en https://github.com/emirhanbilgic/INP-X.

English

Modern deep learning-based inpainting enables realistic local image manipulation, raising critical challenges for reliable detection. However, we observe that current detectors primarily rely on global artifacts that appear as inpainting side effects, rather than on locally synthesized content. We show that this behavior occurs because VAE-based reconstruction induces a subtle but pervasive spectral shift across the entire image, including unedited regions. To isolate this effect, we introduce Inpainting Exchange (INP-X), an operation that restores original pixels outside the edited region while preserving all synthesized content. We create a 90K test dataset including real, inpainted, and exchanged images to evaluate this phenomenon. Under this intervention, pretrained state-of-the-art detectors, including commercial ones, exhibit a dramatic drop in accuracy (e.g., from 91\% to 55\%), frequently approaching chance level. We provide a theoretical analysis linking this behavior to high-frequency attenuation caused by VAE information bottlenecks. Our findings highlight the need for content-aware detection. Indeed, training on our dataset yields better generalization and localization than standard inpainting. Our dataset and code are publicly available at https://github.com/emirhanbilgic/INP-X.