정확한 멀티미디어 콘텐츠의 강건하고 보정된 탐지
Robust and Calibrated Detection of Authentic Multimedia Content
December 17, 2025
저자: Sarim Hashmi, Abdelrahman Elsayed, Mohammed Talha Alam, Samuele Poppi, Nils Lukas
cs.AI
초록
생성 모델은 매우 사실적인 콘텐츠, 이른바 딥페이크를 합성할 수 있으며, 이는 이미 디지털 미디어의 진위를 훼손하기 위해 대규모로 악용되고 있습니다. 현재의 딥페이크 탐지 방법은 두 가지 이유로 신뢰할 수 없습니다. (i) 부정확한 콘텐츠를 사후에 구분하는 것은 (예: 기억된 샘플의 경우) 종종 불가능하여 무한한 위양성률(FPR)을 초래합니다. (ii) 탐지 방법은 강건성이 부족한데, 이는 공격자가 최소한의 계산 자원으로 알려진 탐지기를 거의 완벽한 정확도로 적응하여 회피할 수 있기 때문입니다. 이러한 한계를 해결하기 위해, 우리는 어떤 샘플이 진본인지 또는 그 진위를 설득력 있게 부인할 수 있는지를 판단하는 재합성 프레임워크를 제안합니다. 우리는 효율적인(즉, 계산 자원이 제한된) 공격자를 대상으로 하는 고정밀도, 저재현율 설정에 초점을 맞춰 두 가지 주요 기여를 합니다. 첫째, 우리의 보정된 재합성 방법이 통제 가능한 낮은 FPR을 유지하면서 진본 샘플을 검증하는 가장 신뢰할 수 있는 접근법임을 입증합니다. 둘째, 우리의 방법이 효율적인 공격자에 대해 적대적 강건성을 달성하는 반면, 기존 방법들은 동일한 계산 예산 하에서 쉽게 회피됨을 보여줍니다. 우리의 접근법은 다중 모달리티를 지원하며 최첨단 인버전 기술을 활용합니다.
English
Generative models can synthesize highly realistic content, so-called deepfakes, that are already being misused at scale to undermine digital media authenticity. Current deepfake detection methods are unreliable for two reasons: (i) distinguishing inauthentic content post-hoc is often impossible (e.g., with memorized samples), leading to an unbounded false positive rate (FPR); and (ii) detection lacks robustness, as adversaries can adapt to known detectors with near-perfect accuracy using minimal computational resources. To address these limitations, we propose a resynthesis framework to determine if a sample is authentic or if its authenticity can be plausibly denied. We make two key contributions focusing on the high-precision, low-recall setting against efficient (i.e., compute-restricted) adversaries. First, we demonstrate that our calibrated resynthesis method is the most reliable approach for verifying authentic samples while maintaining controllable, low FPRs. Second, we show that our method achieves adversarial robustness against efficient adversaries, whereas prior methods are easily evaded under identical compute budgets. Our approach supports multiple modalities and leverages state-of-the-art inversion techniques.