Human101: Обучение гауссовых моделей человека с частотой 100+ кадров в секунду за 100 секунд с одного ракурса

Аннотация

Реконструкция человеческого тела на основе видео с одного ракурса играет ключевую роль в области виртуальной реальности. Одним из распространенных сценариев применения является необходимость быстрого создания высококачественных 3D-моделей цифровых людей с одновременным обеспечением их рендеринга и взаимодействия в реальном времени. Существующие методы часто не способны удовлетворить оба этих требования. В данной статье мы представляем Human101 — новый фреймворк, способный создавать высококачественные динамические 3D-реконструкции человека на основе видео с одного ракурса, обучая 3D-гауссовы распределения за 100 секунд и обеспечивая рендеринг со скоростью более 100 кадров в секунду. Наш метод использует преимущества 3D Gaussian Splatting, который предоставляет явное и эффективное представление 3D-моделей человека. В отличие от предыдущих подходов, основанных на NeRF, Human101 применяет инновационный метод Human-centric Forward Gaussian Animation для деформации параметров 3D-гауссовых распределений, что значительно повышает скорость рендеринга (например, рендеринг изображений с разрешением 1024 с впечатляющими 60+ кадрами в секунду и изображений с разрешением 512 с 100+ кадрами в секунду). Результаты экспериментов показывают, что наш подход значительно превосходит существующие методы, увеличивая количество кадров в секунду до 10 раз и обеспечивая сопоставимое или превосходное качество рендеринга. Код и демонстрации будут доступны по адресу https://github.com/longxiang-ai/Human101.

English

Reconstructing the human body from single-view videos plays a pivotal role in the virtual reality domain. One prevalent application scenario necessitates the rapid reconstruction of high-fidelity 3D digital humans while simultaneously ensuring real-time rendering and interaction. Existing methods often struggle to fulfill both requirements. In this paper, we introduce Human101, a novel framework adept at producing high-fidelity dynamic 3D human reconstructions from 1-view videos by training 3D Gaussians in 100 seconds and rendering in 100+ FPS. Our method leverages the strengths of 3D Gaussian Splatting, which provides an explicit and efficient representation of 3D humans. Standing apart from prior NeRF-based pipelines, Human101 ingeniously applies a Human-centric Forward Gaussian Animation method to deform the parameters of 3D Gaussians, thereby enhancing rendering speed (i.e., rendering 1024-resolution images at an impressive 60+ FPS and rendering 512-resolution images at 100+ FPS). Experimental results indicate that our approach substantially eclipses current methods, clocking up to a 10 times surge in frames per second and delivering comparable or superior rendering quality. Code and demos will be released at https://github.com/longxiang-ai/Human101.

Human101: Обучение гауссовых моделей человека с частотой 100+ кадров в секунду за 100 секунд с одного ракурса

Human101: Training 100+FPS Human Gaussians in 100s from 1 View

Аннотация

Support