DeMamba: KI-generierte Videodetektion auf der GenVideo-Benchmark im Millionenumfang

papers.abstract

In letzter Zeit haben sich die Techniken zur Videogenerierung rasant weiterentwickelt. Angesichts der Beliebtheit von Videoinhalten auf Social-Media-Plattformen verstärken diese Modelle Bedenken hinsichtlich der Verbreitung von falschen Informationen. Daher besteht eine wachsende Nachfrage nach Detektoren, die in der Lage sind, zwischen gefälschten KI-generierten Videos zu unterscheiden und die potenziellen Schäden durch falsche Informationen zu mindern. Allerdings stellt der Mangel an groß angelegten Datensätzen der fortschrittlichsten Videogeneratoren eine Hürde für die Entwicklung solcher Detektoren dar. Um diese Lücke zu schließen, stellen wir den ersten KI-generierten Videoerkennungsdatensatz, GenVideo, vor. Er zeichnet sich durch folgende Merkmale aus: (1) ein großes Volumen an Videos, darunter über eine Million KI-generierte und echte gesammelte Videos; (2) eine reiche Vielfalt an generierten Inhalten und Methoden, die ein breites Spektrum von Videokategorien und Generierungstechniken abdecken. Wir führten umfangreiche Studien des Datensatzes durch und schlugen zwei Bewertungsmethoden vor, die für Szenarien ähnlich der realen Welt entwickelt wurden, um die Leistung der Detektoren zu bewerten: Die Aufgabe der Videoklassifizierung über verschiedene Generatoren bewertet die Generalisierbarkeit der trainierten Detektoren auf Generatoren; die Aufgabe der Klassifizierung von degradierten Videos bewertet die Robustheit der Detektoren im Umgang mit Videos, die während der Verbreitung an Qualität verloren haben. Darüber hinaus haben wir ein Plug-and-Play-Modul namens Detail Mamba (DeMamba) eingeführt, das entwickelt wurde, um die Detektoren zu verbessern, indem es KI-generierte Videos durch die Analyse von Inkonsistenzen in zeitlichen und räumlichen Dimensionen identifiziert. Unsere umfangreichen Experimente zeigen die überlegene Generalisierbarkeit und Robustheit von DeMamba auf GenVideo im Vergleich zu bestehenden Detektoren. Wir sind der Überzeugung, dass der GenVideo-Datensatz und das DeMamba-Modul das Feld der KI-generierten Videoerkennung maßgeblich voranbringen werden. Unser Code und Datensatz sind unter https://github.com/chenhaoxing/DeMamba verfügbar.

English

Recently, video generation techniques have advanced rapidly. Given the popularity of video content on social media platforms, these models intensify concerns about the spread of fake information. Therefore, there is a growing demand for detectors capable of distinguishing between fake AI-generated videos and mitigating the potential harm caused by fake information. However, the lack of large-scale datasets from the most advanced video generators poses a barrier to the development of such detectors. To address this gap, we introduce the first AI-generated video detection dataset, GenVideo. It features the following characteristics: (1) a large volume of videos, including over one million AI-generated and real videos collected; (2) a rich diversity of generated content and methodologies, covering a broad spectrum of video categories and generation techniques. We conducted extensive studies of the dataset and proposed two evaluation methods tailored for real-world-like scenarios to assess the detectors' performance: the cross-generator video classification task assesses the generalizability of trained detectors on generators; the degraded video classification task evaluates the robustness of detectors to handle videos that have degraded in quality during dissemination. Moreover, we introduced a plug-and-play module, named Detail Mamba (DeMamba), designed to enhance the detectors by identifying AI-generated videos through the analysis of inconsistencies in temporal and spatial dimensions. Our extensive experiments demonstrate DeMamba's superior generalizability and robustness on GenVideo compared to existing detectors. We believe that the GenVideo dataset and the DeMamba module will significantly advance the field of AI-generated video detection. Our code and dataset will be aviliable at https://github.com/chenhaoxing/DeMamba.

DeMamba: KI-generierte Videodetektion auf der GenVideo-Benchmark im Millionenumfang

DeMamba: AI-Generated Video Detection on Million-Scale GenVideo Benchmark

papers.abstract

Support