ChatPaper.aiChatPaper

Flotter n'est plus : Reconstruction Objet-Sol à partir d'une seule image

Floating No More: Object-Ground Reconstruction from a Single Image

July 26, 2024
Auteurs: Yunze Man, Yichen Sheng, Jianming Zhang, Liang-Yan Gui, Yu-Xiong Wang
cs.AI

Résumé

Les récents progrès dans la reconstruction d'objets 3D à partir d'images uniques se sont principalement concentrés sur l'amélioration de la précision des formes des objets. Cependant, ces techniques échouent souvent à capturer avec exactitude l'interrelation entre l'objet, le sol et la caméra. En conséquence, les objets reconstruits apparaissent fréquemment flottants ou inclinés lorsqu'ils sont placés sur des surfaces planes. Cette limitation affecte significativement les applications de retouche d'images 3D, telles que le rendu des ombres et la manipulation de la pose des objets. Pour résoudre ce problème, nous introduisons ORG (Object Reconstruction with Ground), une nouvelle tâche visant à reconstruire la géométrie 3D des objets en conjonction avec la surface du sol. Notre méthode utilise deux représentations compactes au niveau des pixels pour décrire la relation entre la caméra, l'objet et le sol. Les expériences montrent que le modèle ORG proposé peut reconstruire efficacement la géométrie objet-sol sur des données inédites, améliorant considérablement la qualité de la génération d'ombres et de la manipulation de la pose par rapport aux techniques conventionnelles de reconstruction 3D à partir d'une seule image.
English
Recent advancements in 3D object reconstruction from single images have primarily focused on improving the accuracy of object shapes. Yet, these techniques often fail to accurately capture the inter-relation between the object, ground, and camera. As a result, the reconstructed objects often appear floating or tilted when placed on flat surfaces. This limitation significantly affects 3D-aware image editing applications like shadow rendering and object pose manipulation. To address this issue, we introduce ORG (Object Reconstruction with Ground), a novel task aimed at reconstructing 3D object geometry in conjunction with the ground surface. Our method uses two compact pixel-level representations to depict the relationship between camera, object, and ground. Experiments show that the proposed ORG model can effectively reconstruct object-ground geometry on unseen data, significantly enhancing the quality of shadow generation and pose manipulation compared to conventional single-image 3D reconstruction techniques.

Summary

AI-Generated Summary

PDF193November 28, 2024