ChatPaper.aiChatPaper

VGGHeads: крупномасштабный синтетический набор данных для трехмерных голов человека.

VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads

July 25, 2024
Авторы: Orest Kupyn, Eugene Khvedchenia, Christian Rupprecht
cs.AI

Аннотация

Обнаружение головы человека, оценка ключевых точек и подгонка трехмерной модели головы - важные задачи с множеством применений. Однако традиционные реальные наборы данных часто страдают от предвзятости, конфиденциальности и этических проблем, и они были записаны в лабораторных условиях, что затрудняет обобщение обученных моделей. Здесь мы представляем VGGHeads - крупномасштабный синтетический набор данных, созданный с использованием моделей диффузии для обнаружения головы человека и оценки трехмерной сетки. Наш набор данных включает более 1 миллиона изображений высокого разрешения, каждое аннотировано подробными трехмерными сетками головы, точками на лице и ограничивающими рамками. Используя этот набор данных, мы представляем новую архитектуру модели, способную одновременно обнаруживать головы и восстанавливать трехмерные сетки головы из одного изображения за один шаг. Через обширные экспериментальные оценки мы демонстрируем, что модели, обученные на наших синтетических данных, достигают высокой производительности на реальных изображениях. Более того, универсальность нашего набора данных делает его применимым в широком спектре задач, предлагая общее и всестороннее представление о головах человека. Кроме того, мы предоставляем подробную информацию о процессе генерации синтетических данных, что позволяет их повторно использовать для других задач и областей.
English
Human head detection, keypoint estimation, and 3D head model fitting are important tasks with many applications. However, traditional real-world datasets often suffer from bias, privacy, and ethical concerns, and they have been recorded in laboratory environments, which makes it difficult for trained models to generalize. Here, we introduce VGGHeads -- a large scale synthetic dataset generated with diffusion models for human head detection and 3D mesh estimation. Our dataset comprises over 1 million high-resolution images, each annotated with detailed 3D head meshes, facial landmarks, and bounding boxes. Using this dataset we introduce a new model architecture capable of simultaneous heads detection and head meshes reconstruction from a single image in a single step. Through extensive experimental evaluations, we demonstrate that models trained on our synthetic data achieve strong performance on real images. Furthermore, the versatility of our dataset makes it applicable across a broad spectrum of tasks, offering a general and comprehensive representation of human heads. Additionally, we provide detailed information about the synthetic data generation pipeline, enabling it to be re-used for other tasks and domains.

Summary

AI-Generated Summary

PDF103November 28, 2024