ChatPaper.aiChatPaper

NAVI: Коллекции изображений, независимые от категорий, с высококачественными аннотациями 3D-форм и поз

NAVI: Category-Agnostic Image Collections with High-Quality 3D Shape and Pose Annotations

June 15, 2023
Авторы: Varun Jampani, Kevis-Kokitsi Maninis, Andreas Engelhardt, Arjun Karpur, Karen Truong, Kyle Sargent, Stefan Popov, André Araujo, Ricardo Martin-Brualla, Kaushal Patel, Daniel Vlasic, Vittorio Ferrari, Ameesh Makadia, Ce Liu, Yuanzhen Li, Howard Zhou
cs.AI

Аннотация

Последние достижения в области нейронной реконструкции позволяют создавать высококачественные 3D-модели объектов на основе случайно собранных коллекций изображений. Современные методы в основном оценивают свой прогресс на относительно простых наборах изображений, где техники Structure-from-Motion (SfM) могут предоставить эталонные (GT) параметры камер. Мы отмечаем, что методы SfM часто не справляются с обработкой изображений, снятых в реальных условиях, таких как результаты поиска изображений с различными фонами и освещением. Для обеспечения систематического прогресса в исследованиях 3D-реконструкции на основе случайных изображений мы представляем NAVI: новый набор данных, содержащий категорийно-независимые коллекции изображений объектов с высококачественными 3D-сканами, а также точные 2D-3D соответствия, предоставляющие почти идеальные эталонные параметры камер. Эти 2D-3D соответствия позволяют извлекать точные производные аннотации, такие как плотные пиксельные соответствия, карты глубины и сегментации. Мы демонстрируем использование коллекций изображений NAVI в различных задачах и показываем, что NAVI позволяет проводить более тщательные оценки, которые были невозможны с существующими наборами данных. Мы считаем, что NAVI способствует систематическому прогрессу в исследованиях 3D-реконструкции и оценки соответствий. Страница проекта: https://navidataset.github.io.
English
Recent advances in neural reconstruction enable high-quality 3D object reconstruction from casually captured image collections. Current techniques mostly analyze their progress on relatively simple image collections where Structure-from-Motion (SfM) techniques can provide ground-truth (GT) camera poses. We note that SfM techniques tend to fail on in-the-wild image collections such as image search results with varying backgrounds and illuminations. To enable systematic research progress on 3D reconstruction from casual image captures, we propose NAVI: a new dataset of category-agnostic image collections of objects with high-quality 3D scans along with per-image 2D-3D alignments providing near-perfect GT camera parameters. These 2D-3D alignments allow us to extract accurate derivative annotations such as dense pixel correspondences, depth and segmentation maps. We demonstrate the use of NAVI image collections on different problem settings and show that NAVI enables more thorough evaluations that were not possible with existing datasets. We believe NAVI is beneficial for systematic research progress on 3D reconstruction and correspondence estimation. Project page: https://navidataset.github.io
PDF40December 15, 2024