ChatPaper.aiChatPaper

Neural LightRig: Desbloqueando la Estimación Precisa de Normales de Objetos y Materiales con Difusión de Múltiples Luces

Neural LightRig: Unlocking Accurate Object Normal and Material Estimation with Multi-Light Diffusion

December 12, 2024
Autores: Zexin He, Tengfei Wang, Xin Huang, Xingang Pan, Ziwei Liu
cs.AI

Resumen

Recuperar la geometría y los materiales de objetos a partir de una sola imagen es desafiante debido a su naturaleza subdeterminada. En este documento, presentamos Neural LightRig, un marco novedoso que potencia la estimación intrínseca al aprovechar condiciones auxiliares de iluminación múltiple de difusión 2D. Específicamente, 1) primero aprovechamos priors de iluminación de modelos de difusión a gran escala para construir nuestro modelo de difusión de luz múltiple en un conjunto de datos de relighting sintético con diseños dedicados. Este modelo de difusión genera múltiples imágenes consistentes, cada una iluminada por fuentes de luz puntual en diferentes direcciones. 2) Utilizando estas imágenes de iluminación variadas para reducir la incertidumbre de la estimación, entrenamos un gran modelo de búfer G con una estructura de U-Net para predecir con precisión las normales de superficie y los materiales. Experimentos extensos validan que nuestro enfoque supera significativamente a los métodos de vanguardia, permitiendo una estimación precisa de las normales de superficie y los materiales PBR con efectos de relighting vívidos. El código y el conjunto de datos están disponibles en nuestra página de proyecto en https://projects.zxhezexin.com/neural-lightrig.
English
Recovering the geometry and materials of objects from a single image is challenging due to its under-constrained nature. In this paper, we present Neural LightRig, a novel framework that boosts intrinsic estimation by leveraging auxiliary multi-lighting conditions from 2D diffusion priors. Specifically, 1) we first leverage illumination priors from large-scale diffusion models to build our multi-light diffusion model on a synthetic relighting dataset with dedicated designs. This diffusion model generates multiple consistent images, each illuminated by point light sources in different directions. 2) By using these varied lighting images to reduce estimation uncertainty, we train a large G-buffer model with a U-Net backbone to accurately predict surface normals and materials. Extensive experiments validate that our approach significantly outperforms state-of-the-art methods, enabling accurate surface normal and PBR material estimation with vivid relighting effects. Code and dataset are available on our project page at https://projects.zxhezexin.com/neural-lightrig.

Summary

AI-Generated Summary

PDF184December 13, 2024