ChatPaper.aiChatPaper

Надежное и калиброванное обнаружение подлинного мультимедийного контента

Robust and Calibrated Detection of Authentic Multimedia Content

December 17, 2025
Авторы: Sarim Hashmi, Abdelrahman Elsayed, Mohammed Talha Alam, Samuele Poppi, Nils Lukas
cs.AI

Аннотация

Генеративные модели способны синтезировать высокореалистичный контент, так называемые дипфейки, который уже массово используется для подрыва достоверности цифровых медиа. Современные методы обнаружения дипфейков ненадежны по двум причинам: (i) последующее различение недостоверного контента часто невозможно (например, с запомненными образцами), что приводит к неограниченному уровню ложноположительных срабатываний (FPR); и (ii) обнаружению не хватает устойчивости, поскольку злоумышленники могут адаптироваться к известным детекторам с почти идеальной точностью, используя минимальные вычислительные ресурсы. Для преодоления этих ограничений мы предлагаем фреймворк повторного синтеза, позволяющий определить, является ли образец подлинным или его аутентичность может быть правдоподобно оспорена. Мы делаем два ключевых вклада, ориентируясь на настройку высокой точности при низкой полноте в условиях противодействия эффективным (т.е. с ограниченными вычислительными ресурсами) оппонентам. Во-первых, мы демонстрируем, что наш калиброванный метод повторного синтеза является наиболее надежным подходом для верификации подлинных образцов при сохранении контролируемо низкого FPR. Во-вторых, мы показываем, что наш метод обеспечивает устойчивость к атакам со стороны эффективных противников, в то время как предыдущие методы легко обходятся при идентичных вычислительных бюджетах. Наш подход поддерживает работу с несколькими модальностями и использует передовые методы инверсии.
English
Generative models can synthesize highly realistic content, so-called deepfakes, that are already being misused at scale to undermine digital media authenticity. Current deepfake detection methods are unreliable for two reasons: (i) distinguishing inauthentic content post-hoc is often impossible (e.g., with memorized samples), leading to an unbounded false positive rate (FPR); and (ii) detection lacks robustness, as adversaries can adapt to known detectors with near-perfect accuracy using minimal computational resources. To address these limitations, we propose a resynthesis framework to determine if a sample is authentic or if its authenticity can be plausibly denied. We make two key contributions focusing on the high-precision, low-recall setting against efficient (i.e., compute-restricted) adversaries. First, we demonstrate that our calibrated resynthesis method is the most reliable approach for verifying authentic samples while maintaining controllable, low FPRs. Second, we show that our method achieves adversarial robustness against efficient adversaries, whereas prior methods are easily evaded under identical compute budgets. Our approach supports multiple modalities and leverages state-of-the-art inversion techniques.
PDF152December 19, 2025