ChatPaper.aiChatPaper

Neuronales LightRig: Entsperrung genauer Objektnormalen- und Materialeinschätzung mit Multi-Licht-Diffusion

Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion

December 12, 2024
Autoren: Zexin He, Tengfei Wang, Xin Huang, Xingang Pan, Ziwei Liu
cs.AI

Zusammenfassung

Die Wiederherstellung der Geometrie und Materialien von Objekten aus einem einzigen Bild ist aufgrund seiner unzureichenden Bedingungen eine Herausforderung. In diesem Artikel präsentieren wir Neural LightRig, ein neuartiges Framework, das die intrinsische Schätzung durch die Nutzung von zusätzlichen Multi-Beleuchtungsbedingungen aus 2D-Diffusionspriors verbessert. Konkret nutzen wir zunächst Beleuchtungspriors aus groß angelegten Diffusionsmodellen, um unser Multi-Licht-Diffusionsmodell auf einem synthetischen Beleuchtungsdatensatz mit speziellen Designs zu erstellen. Dieses Diffusionsmodell erzeugt mehrere konsistente Bilder, die jeweils von Punktlichtquellen in verschiedenen Richtungen beleuchtet werden. Durch die Verwendung dieser unterschiedlichen Beleuchtungsbilder zur Reduzierung der Schätzungunsicherheit trainieren wir ein großes G-Buffer-Modell mit einem U-Net-Backbone, um Oberflächennormalen und Materialien genau vorherzusagen. Umfangreiche Experimente bestätigen, dass unser Ansatz signifikant bessere Leistungen als die modernsten Methoden erbringt und eine präzise Schätzung der Oberflächennormalen und PBR-Materialien mit lebendigen Beleuchtungseffekten ermöglicht. Der Code und der Datensatz sind auf unserer Projektseite unter https://projects.zxhezexin.com/neural-lightrig verfügbar.
English
Recovering the geometry and materials of objects from a single image is challenging due to its under-constrained nature. In this paper, we present Neural LightRig, a novel framework that boosts intrinsic estimation by leveraging auxiliary multi-lighting conditions from 2D diffusion priors. Specifically, 1) we first leverage illumination priors from large-scale diffusion models to build our multi-light diffusion model on a synthetic relighting dataset with dedicated designs. This diffusion model generates multiple consistent images, each illuminated by point light sources in different directions. 2) By using these varied lighting images to reduce estimation uncertainty, we train a large G-buffer model with a U-Net backbone to accurately predict surface normals and materials. Extensive experiments validate that our approach significantly outperforms state-of-the-art methods, enabling accurate surface normal and PBR material estimation with vivid relighting effects. Code and dataset are available on our project page at https://projects.zxhezexin.com/neural-lightrig.

Summary

AI-Generated Summary

PDF184December 13, 2024