ChatPaper.aiChatPaper

HiFi4G: Hochauflösendes Rendering menschlicher Leistung durch kompakte Gaußsche Splatting

HiFi4G: High-Fidelity Human Performance Rendering via Compact Gaussian Splatting

December 6, 2023
papers.authors: Yuheng Jiang, Zhehao Shen, Penghao Wang, Zhuo Su, Yu Hong, Yingliang Zhang, Jingyi Yu, Lan Xu
cs.AI

papers.abstract

Wir haben in letzter Zeit enorme Fortschritte bei der fotorealistischen Modellierung und Darstellung von Menschen gesehen. Dennoch bleibt die effiziente Darstellung realistischer menschlicher Bewegungen und deren Integration in den Rasterisierungspipeline eine Herausforderung. In diesem Artikel präsentieren wir HiFi4G, einen expliziten und kompakten, auf Gaußschen Basen beruhenden Ansatz für die hochauflösende Darstellung menschlicher Bewegungen aus dichten Aufnahmen. Unser zentraler Ansatz besteht darin, die 3D-Gaußsche Darstellung mit nicht-starrer Nachverfolgung zu kombinieren, um eine kompakte und kompressionsfreundliche Repräsentation zu erreichen. Zunächst schlagen wir einen Dual-Graph-Mechanismus vor, um Bewegungs-Priors zu erhalten, mit einem groben Deformationsgraphen für eine effektive Initialisierung und einem feinkörnigen Gaußschen Graphen zur Durchsetzung nachfolgender Einschränkungen. Anschließend nutzen wir ein 4D-Gaußsches Optimierungsschema mit adaptiven räumlich-zeitlichen Regularisierern, um das nicht-starre Prior und die Gaußsche Aktualisierung effektiv auszubalancieren. Wir stellen auch ein begleitendes Kompressionsschema mit Restkompensation für immersive Erlebnisse auf verschiedenen Plattformen vor. Es erreicht eine erhebliche Kompressionsrate von etwa 25-fach, mit weniger als 2 MB Speicher pro Frame. Umfangreiche Experimente demonstrieren die Effektivität unseres Ansatzes, der bestehende Methoden in Bezug auf Optimierungsgeschwindigkeit, Darstellungsqualität und Speicheraufwand deutlich übertrifft.
English
We have recently seen tremendous progress in photo-real human modeling and rendering. Yet, efficiently rendering realistic human performance and integrating it into the rasterization pipeline remains challenging. In this paper, we present HiFi4G, an explicit and compact Gaussian-based approach for high-fidelity human performance rendering from dense footage. Our core intuition is to marry the 3D Gaussian representation with non-rigid tracking, achieving a compact and compression-friendly representation. We first propose a dual-graph mechanism to obtain motion priors, with a coarse deformation graph for effective initialization and a fine-grained Gaussian graph to enforce subsequent constraints. Then, we utilize a 4D Gaussian optimization scheme with adaptive spatial-temporal regularizers to effectively balance the non-rigid prior and Gaussian updating. We also present a companion compression scheme with residual compensation for immersive experiences on various platforms. It achieves a substantial compression rate of approximately 25 times, with less than 2MB of storage per frame. Extensive experiments demonstrate the effectiveness of our approach, which significantly outperforms existing approaches in terms of optimization speed, rendering quality, and storage overhead.
PDF171December 15, 2024