ChatPaper.aiChatPaper

Набор данных DeepSpeak v1.0

DeepSpeak Dataset v1.0

August 9, 2024
Авторы: Sarah Barrington, Matyas Bohacek, Hany Farid
cs.AI

Аннотация

Мы описываем крупномасштабный набор данных - {\em DeepSpeak} - реальных и глубокофейковых видеозаписей людей, разговаривающих и жестикулирующих перед веб-камерами. Реальные видеозаписи в этой первой версии набора данных составляют 9 часов материала от 220 разнообразных людей. Фейковые видеозаписи включают в себя более 25 часов материала, представляющие собой различные передовые технологии замены лица и синхронизации губ с натуральными и ИИ-сгенерированными голосами. Мы планируем выпустить будущие версии этого набора данных с различными и обновленными технологиями глубокого фейка. Этот набор данных предоставляется бесплатно для исследований и некоммерческого использования; запросы на коммерческое использование будут рассмотрены.
English
We describe a large-scale dataset--{\em DeepSpeak}--of real and deepfake footage of people talking and gesturing in front of their webcams. The real videos in this first version of the dataset consist of 9 hours of footage from 220 diverse individuals. Constituting more than 25 hours of footage, the fake videos consist of a range of different state-of-the-art face-swap and lip-sync deepfakes with natural and AI-generated voices. We expect to release future versions of this dataset with different and updated deepfake technologies. This dataset is made freely available for research and non-commercial uses; requests for commercial use will be considered.

Summary

AI-Generated Summary

PDF135November 28, 2024