ChatPaper.aiChatPaper

DeMamba: Detección de videos generados por IA en el benchmark GenVideo de escala millonaria

DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark

May 30, 2024
Autores: Haoxing Chen, Yan Hong, Zizheng Huang, Zhuoer Xu, Zhangxuan Gu, Yaohui Li, Jun Lan, Huijia Zhu, Jianfu Zhang, Weiqiang Wang, Huaxiong Li
cs.AI

Resumen

Recientemente, las técnicas de generación de videos han avanzado rápidamente. Dada la popularidad del contenido de video en las plataformas de redes sociales, estos modelos intensifican las preocupaciones sobre la propagación de información falsa. Por lo tanto, existe una creciente demanda de detectores capaces de distinguir entre videos generados por IA falsos y mitigar el daño potencial causado por la información falsa. Sin embargo, la falta de conjuntos de datos a gran escala de los generadores de video más avanzados representa una barrera para el desarrollo de dichos detectores. Para abordar esta brecha, presentamos el primer conjunto de datos de detección de videos generados por IA, GenVideo. Cuenta con las siguientes características: (1) un gran volumen de videos, incluyendo más de un millón de videos generados por IA y videos reales recopilados; (2) una rica diversidad de contenido generado y metodologías, cubriendo un amplio espectro de categorías de video y técnicas de generación. Realizamos estudios extensos del conjunto de datos y propusimos dos métodos de evaluación adaptados a escenarios similares a los del mundo real para evaluar el rendimiento de los detectores: la tarea de clasificación de videos entre generadores evalúa la generalización de los detectores entrenados en diferentes generadores; la tarea de clasificación de videos degradados evalúa la robustez de los detectores para manejar videos que han perdido calidad durante su difusión. Además, introdujimos un módulo plug-and-play, llamado Detail Mamba (DeMamba), diseñado para mejorar los detectores al identificar videos generados por IA mediante el análisis de inconsistencias en las dimensiones temporales y espaciales. Nuestros extensos experimentos demuestran la superior generalización y robustez de DeMamba en GenVideo en comparación con los detectores existentes. Creemos que el conjunto de datos GenVideo y el módulo DeMamba avanzarán significativamente el campo de la detección de videos generados por IA. Nuestro código y conjunto de datos estarán disponibles en https://github.com/chenhaoxing/DeMamba.
English
Recently, video generation techniques have advanced rapidly. Given the popularity of video content on social media platforms, these models intensify concerns about the spread of fake information. Therefore, there is a growing demand for detectors capable of distinguishing between fake AI-generated videos and mitigating the potential harm caused by fake information. However, the lack of large-scale datasets from the most advanced video generators poses a barrier to the development of such detectors. To address this gap, we introduce the first AI-generated video detection dataset, GenVideo. It features the following characteristics: (1) a large volume of videos, including over one million AI-generated and real videos collected; (2) a rich diversity of generated content and methodologies, covering a broad spectrum of video categories and generation techniques. We conducted extensive studies of the dataset and proposed two evaluation methods tailored for real-world-like scenarios to assess the detectors' performance: the cross-generator video classification task assesses the generalizability of trained detectors on generators; the degraded video classification task evaluates the robustness of detectors to handle videos that have degraded in quality during dissemination. Moreover, we introduced a plug-and-play module, named Detail Mamba (DeMamba), designed to enhance the detectors by identifying AI-generated videos through the analysis of inconsistencies in temporal and spatial dimensions. Our extensive experiments demonstrate DeMamba's superior generalizability and robustness on GenVideo compared to existing detectors. We believe that the GenVideo dataset and the DeMamba module will significantly advance the field of AI-generated video detection. Our code and dataset will be aviliable at https://github.com/chenhaoxing/DeMamba.

Summary

AI-Generated Summary

PDF70December 12, 2024