ChatPaper.aiChatPaper

Schwimmend war gestern: Objekt-Grund-Rekonstruktion aus einem einzigen Bild

Floating No More: Object-Ground Reconstruction from a Single Image

July 26, 2024
Autoren: Yunze Man, Yichen Sheng, Jianming Zhang, Liang-Yan Gui, Yu-Xiong Wang
cs.AI

Zusammenfassung

In jüngster Zeit lag der Schwerpunkt bei den Fortschritten in der 3D-Objektrekonstruktion aus Einzelbildern hauptsächlich auf der Verbesserung der Genauigkeit der Objektformen. Dennoch scheitern diese Techniken oft daran, die Wechselbeziehung zwischen dem Objekt, dem Boden und der Kamera genau zu erfassen. Als Ergebnis erscheinen die rekonstruierten Objekte häufig schwebend oder geneigt, wenn sie auf flachen Oberflächen platziert werden. Diese Einschränkung beeinträchtigt signifikant 3D-bewusste Bildbearbeitungsanwendungen wie Schattenwiedergabe und Objektpositionsmanipulation. Um dieses Problem anzugehen, stellen wir ORG (Objektrekonstruktion mit Boden) vor, eine neuartige Aufgabe, die darauf abzielt, die 3D-Objektgeometrie in Verbindung mit der Bodenoberfläche zu rekonstruieren. Unsere Methode verwendet zwei kompakte pixelbasierte Darstellungen, um die Beziehung zwischen Kamera, Objekt und Boden darzustellen. Experimente zeigen, dass das vorgeschlagene ORG-Modell die Objekt-Boden-Geometrie auf ungesehenen Daten effektiv rekonstruieren kann und im Vergleich zu herkömmlichen 3D-Rekonstruktionstechniken aus Einzelbildern die Qualität der Schattenerzeugung und der Positionsmanipulation des Objekts signifikant verbessert.
English
Recent advancements in 3D object reconstruction from single images have primarily focused on improving the accuracy of object shapes. Yet, these techniques often fail to accurately capture the inter-relation between the object, ground, and camera. As a result, the reconstructed objects often appear floating or tilted when placed on flat surfaces. This limitation significantly affects 3D-aware image editing applications like shadow rendering and object pose manipulation. To address this issue, we introduce ORG (Object Reconstruction with Ground), a novel task aimed at reconstructing 3D object geometry in conjunction with the ground surface. Our method uses two compact pixel-level representations to depict the relationship between camera, object, and ground. Experiments show that the proposed ORG model can effectively reconstruct object-ground geometry on unseen data, significantly enhancing the quality of shadow generation and pose manipulation compared to conventional single-image 3D reconstruction techniques.

Summary

AI-Generated Summary

PDF193November 28, 2024