Не плавающий больше: восстановление объекта-фона из одного изображения

Аннотация

Недавние достижения в восстановлении трехмерных объектов из одиночных изображений в основном сосредоточены на улучшении точности форм объектов. Тем не менее, эти техники часто не могут точно захватить взаимосвязь между объектом, поверхностью и камерой. В результате восстановленные объекты часто кажутся парящими или наклоненными при размещении на плоских поверхностях. Это ограничение существенно влияет на приложения по редактированию изображений с учетом трехмерного пространства, такие как генерация теней и манипулирование позой объекта. Для решения этой проблемы мы представляем ORG (Object Reconstruction with Ground) - новую задачу, направленную на восстановление геометрии трехмерных объектов в сочетании с поверхностью земли. Наш метод использует два компактных представления на уровне пикселей для описания взаимосвязи между камерой, объектом и поверхностью земли. Эксперименты показывают, что предложенная модель ORG может эффективно восстанавливать геометрию объекта и поверхности земли на невидимых данных, значительно улучшая качество генерации теней и манипулирования позой по сравнению с традиционными техниками восстановления трехмерных объектов из одиночных изображений.

English

Recent advancements in 3D object reconstruction from single images have primarily focused on improving the accuracy of object shapes. Yet, these techniques often fail to accurately capture the inter-relation between the object, ground, and camera. As a result, the reconstructed objects often appear floating or tilted when placed on flat surfaces. This limitation significantly affects 3D-aware image editing applications like shadow rendering and object pose manipulation. To address this issue, we introduce ORG (Object Reconstruction with Ground), a novel task aimed at reconstructing 3D object geometry in conjunction with the ground surface. Our method uses two compact pixel-level representations to depict the relationship between camera, object, and ground. Experiments show that the proposed ORG model can effectively reconstruct object-ground geometry on unseen data, significantly enhancing the quality of shadow generation and pose manipulation compared to conventional single-image 3D reconstruction techniques.

Не плавающий больше: восстановление объекта-фона из одного изображения

Floating No More: Object-Ground Reconstruction from a Single Image

Аннотация

Support