재조명 가능한 가우시안 코덱 아바타
Relightable Gaussian Codec Avatars
December 6, 2023
저자: Shunsuke Saito, Gabriel Schwartz, Tomas Simon, Junxuan Li, Giljoo Nam
cs.AI
초록
재조명의 충실도는 기하학적 표현과 외관 표현 모두에 의해 제한됩니다. 기하학적 측면에서, 메시와 볼륨 기반 접근법 모두 3D 헤어 기하학과 같은 복잡한 구조를 모델링하는 데 어려움을 겪습니다. 외관 측면에서, 기존의 재조명 모델들은 충실도가 제한적이며 고해상도의 연속적인 환경에서 실시간으로 렌더링하기에는 너무 느린 경우가 많습니다. 본 연구에서는 새로운 표정을 생성할 수 있는 애니메이션 가능한 고충실도 재조명 가능한 헤드 아바타를 구축하는 방법인 Relightable Gaussian Codec Avatars를 제시합니다. 3D 가우시안을 기반으로 한 우리의 기하학적 모델은 동적 얼굴 시퀀스에서 헤어 스트랜드와 모공과 같은 3D 일관성을 유지하는 서브밀리미터 단위의 세부 사항을 포착할 수 있습니다. 눈, 피부, 헤어와 같은 인간 머리의 다양한 재질을 통합적으로 지원하기 위해, 학습 가능한 방사 전달(learnable radiance transfer)을 기반으로 한 새로운 재조명 가능한 외관 모델을 제시합니다. 확산 성분을 위한 전역 조명 인식 구면 조화 함수(global illumination-aware spherical harmonics)와 함께, 구면 가우시안(spherical Gaussians)을 사용하여 공간적으로 모든 주파수의 반사를 실시간으로 재조명합니다. 이 외관 모델은 점 광원과 연속 조명 하에서 모두 효율적으로 재조명될 수 있습니다. 또한, 재조명 가능한 명시적 눈 모델을 도입하여 눈 반사의 충실도를 향상시키고 명시적인 시선 제어를 가능하게 합니다. 우리의 방법은 실시간 성능을 저해하지 않으면서 기존 접근법을 능가합니다. 또한, 테더링된 소비자용 VR 헤드셋에서 아바타의 실시간 재조명을 시연하여 우리 아바타의 효율성과 충실도를 입증합니다.
English
The fidelity of relighting is bounded by both geometry and appearance
representations. For geometry, both mesh and volumetric approaches have
difficulty modeling intricate structures like 3D hair geometry. For appearance,
existing relighting models are limited in fidelity and often too slow to render
in real-time with high-resolution continuous environments. In this work, we
present Relightable Gaussian Codec Avatars, a method to build high-fidelity
relightable head avatars that can be animated to generate novel expressions.
Our geometry model based on 3D Gaussians can capture 3D-consistent
sub-millimeter details such as hair strands and pores on dynamic face
sequences. To support diverse materials of human heads such as the eyes, skin,
and hair in a unified manner, we present a novel relightable appearance model
based on learnable radiance transfer. Together with global illumination-aware
spherical harmonics for the diffuse components, we achieve real-time relighting
with spatially all-frequency reflections using spherical Gaussians. This
appearance model can be efficiently relit under both point light and continuous
illumination. We further improve the fidelity of eye reflections and enable
explicit gaze control by introducing relightable explicit eye models. Our
method outperforms existing approaches without compromising real-time
performance. We also demonstrate real-time relighting of avatars on a tethered
consumer VR headset, showcasing the efficiency and fidelity of our avatars.