ChatPaper.aiChatPaper

Hi3DGen : Génération de géométrie 3D haute fidélité à partir d'images via un pontage des normales

Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging

March 28, 2025
papers.authors: Chongjie Ye, Yushuang Wu, Ziteng Lu, Jiahao Chang, Xiaoyang Guo, Jiaqing Zhou, Hao Zhao, Xiaoguang Han
cs.AI

papers.abstract

Face à la demande croissante de modèles 3D haute fidélité à partir d'images 2D, les méthodes existantes rencontrent encore des défis importants pour reproduire avec précision les détails géométriques fins, en raison des écarts de domaine et des ambiguïtés inhérentes aux images RGB. Pour résoudre ces problèmes, nous proposons Hi3DGen, un nouveau cadre pour générer une géométrie 3D haute fidélité à partir d'images via une représentation intermédiaire de cartes normales. Hi3DGen se compose de trois éléments clés : (1) un estimateur image-vers-normale qui découple les motifs d'image basse et haute fréquence avec injection de bruit et un entraînement à double flux pour obtenir une estimation généralisable, stable et précise ; (2) une approche d'apprentissage normale-vers-géométrie qui utilise un apprentissage par diffusion latente régularisé par les normales pour améliorer la fidélité de la génération de géométrie 3D ; et (3) un pipeline de synthèse de données 3D qui construit un jeu de données de haute qualité pour soutenir l'entraînement. Des expériences approfondies démontrent l'efficacité et la supériorité de notre cadre pour générer des détails géométriques riches, surpassant les méthodes de pointe en termes de fidélité. Notre travail ouvre une nouvelle direction pour la génération de géométrie 3D haute fidélité à partir d'images en exploitant les cartes normales comme représentation intermédiaire.
English
With the growing demand for high-fidelity 3D models from 2D images, existing methods still face significant challenges in accurately reproducing fine-grained geometric details due to limitations in domain gaps and inherent ambiguities in RGB images. To address these issues, we propose Hi3DGen, a novel framework for generating high-fidelity 3D geometry from images via normal bridging. Hi3DGen consists of three key components: (1) an image-to-normal estimator that decouples the low-high frequency image pattern with noise injection and dual-stream training to achieve generalizable, stable, and sharp estimation; (2) a normal-to-geometry learning approach that uses normal-regularized latent diffusion learning to enhance 3D geometry generation fidelity; and (3) a 3D data synthesis pipeline that constructs a high-quality dataset to support training. Extensive experiments demonstrate the effectiveness and superiority of our framework in generating rich geometric details, outperforming state-of-the-art methods in terms of fidelity. Our work provides a new direction for high-fidelity 3D geometry generation from images by leveraging normal maps as an intermediate representation.
PDF112March 31, 2025