ChatPaper.aiChatPaper

Robuste en Gekalibreerde Detectie van Authentieke Multimediainhoud

Robust and Calibrated Detection of Authentic Multimedia Content

December 17, 2025
Auteurs: Sarim Hashmi, Abdelrahman Elsayed, Mohammed Talha Alam, Samuele Poppi, Nils Lukas
cs.AI

Samenvatting

Generatieve modellen kunnen hoogrealistische content synthetiseren, zogenaamde deepfakes, die reeds op grote schaal worden misbruikt om de authenticiteit van digitale media te ondermijnen. Huidige deepfake-detectiemethoden zijn onbetrouwbaar om twee redenen: (i) het onderscheiden van niet-authentieke content achteraf is vaak onmogelijk (bijvoorbeeld bij gememoriseerde samples), wat leidt tot een onbegrensde false positive rate (FPR); en (ii) detectie mist robuustheid, aangezien aanvallers zich met minimale rekenresources kunnen aanpassen aan bekende detectors met bijna perfecte nauwkeurigheid. Om deze beperkingen aan te pakken, stellen we een hersynthese-raamwerk voor om te bepalen of een sample authentiek is of dat de authenticiteit ervan aannemelijk kan worden ontkend. We leveren twee belangrijke bijdragen gericht op de setting met hoge precisie en lage recall tegen efficiënte (d.w.z. rekenbeperkte) aanvallers. Ten eerste tonen we aan dat onze gekalibreerde hersynthese-methode de meest betrouwbare aanpak is voor het verifiëren van authentieke samples, terwijl beheersbare, lage FPRs worden gehandhaafd. Ten tweede laten we zien dat onze methode adversariële robuustheid bereikt tegen efficiënte aanvallers, terwijl eerdere methoden onder identieke rekenbudgets eenvoudig worden omzeild. Onze aanpak ondersteunt meerdere modaliteiten en maakt gebruik van state-of-the-art inversietechnieken.
English
Generative models can synthesize highly realistic content, so-called deepfakes, that are already being misused at scale to undermine digital media authenticity. Current deepfake detection methods are unreliable for two reasons: (i) distinguishing inauthentic content post-hoc is often impossible (e.g., with memorized samples), leading to an unbounded false positive rate (FPR); and (ii) detection lacks robustness, as adversaries can adapt to known detectors with near-perfect accuracy using minimal computational resources. To address these limitations, we propose a resynthesis framework to determine if a sample is authentic or if its authenticity can be plausibly denied. We make two key contributions focusing on the high-precision, low-recall setting against efficient (i.e., compute-restricted) adversaries. First, we demonstrate that our calibrated resynthesis method is the most reliable approach for verifying authentic samples while maintaining controllable, low FPRs. Second, we show that our method achieves adversarial robustness against efficient adversaries, whereas prior methods are easily evaded under identical compute budgets. Our approach supports multiple modalities and leverages state-of-the-art inversion techniques.
PDF152December 19, 2025