ChatPaper.aiChatPaper

Jeu de données DeepSpeak v1.0

DeepSpeak Dataset v1.0

August 9, 2024
Auteurs: Sarah Barrington, Matyas Bohacek, Hany Farid
cs.AI

Résumé

Nous présentons un ensemble de données à grande échelle--{\em DeepSpeak}--composé de vidéos réelles et de deepfakes montrant des personnes parlant et gesticulant devant leurs webcams. Les vidéos authentiques de cette première version du jeu de données comprennent 9 heures d'enregistrement provenant de 220 individus divers. Les vidéos falsifiées, représentant plus de 25 heures de contenu, incluent une variété de deepfakes de pointe utilisant des techniques de remplacement de visage et de synchronisation labiale, avec des voix naturelles et générées par IA. Nous prévoyons de publier des versions futures de cet ensemble de données avec des technologies de deepfake différentes et mises à jour. Ce jeu de données est mis à disposition gratuitement pour la recherche et les usages non commerciaux ; les demandes d'utilisation commerciale seront examinées.
English
We describe a large-scale dataset--{\em DeepSpeak}--of real and deepfake footage of people talking and gesturing in front of their webcams. The real videos in this first version of the dataset consist of 9 hours of footage from 220 diverse individuals. Constituting more than 25 hours of footage, the fake videos consist of a range of different state-of-the-art face-swap and lip-sync deepfakes with natural and AI-generated voices. We expect to release future versions of this dataset with different and updated deepfake technologies. This dataset is made freely available for research and non-commercial uses; requests for commercial use will be considered.

Summary

AI-Generated Summary

PDF135November 28, 2024