ChatPaper.aiChatPaper

Необычные объекты в 3D.

UnCommon Objects in 3D

January 13, 2025
Авторы: Xingchen Liu, Piyush Tayal, Jianyuan Wang, Jesus Zarzar, Tom Monnier, Konstantinos Tertikas, Jiali Duan, Antoine Toisoul, Jason Y. Zhang, Natalia Neverova, Andrea Vedaldi, Roman Shapovalov, David Novotny
cs.AI

Аннотация

Мы представляем Uncommon Objects in 3D (uCO3D), новый объектно-ориентированный набор данных для трехмерного глубокого обучения и трехмерного генеративного искусственного интеллекта. uCO3D является крупнейшей общедоступной коллекцией высокоразрешенных видео объектов с трехмерными аннотациями, обеспечивающей полное покрытие 360 градусов. uCO3D значительно более разнообразен, чем MVImgNet и CO3Dv2, охватывая более 1,000 категорий объектов. Кроме того, он обладает более высоким качеством благодаря обширным проверкам качества как собранных видео, так и трехмерных аннотаций. Подобно аналогичным наборам данных, uCO3D содержит аннотации для трехмерных поз камер, карт глубины и разреженных облаков точек. Кроме того, каждый объект снабжен подписью и трехмерной реконструкцией с помощью трехмерного гауссова сплетения. Мы обучаем несколько крупных трехмерных моделей на MVImgNet, CO3Dv2 и uCO3D и получаем превосходные результаты с использованием последнего, что показывает, что uCO3D лучше подходит для обучающих приложений.
English
We introduce Uncommon Objects in 3D (uCO3D), a new object-centric dataset for 3D deep learning and 3D generative AI. uCO3D is the largest publicly-available collection of high-resolution videos of objects with 3D annotations that ensures full-360^{circ} coverage. uCO3D is significantly more diverse than MVImgNet and CO3Dv2, covering more than 1,000 object categories. It is also of higher quality, due to extensive quality checks of both the collected videos and the 3D annotations. Similar to analogous datasets, uCO3D contains annotations for 3D camera poses, depth maps and sparse point clouds. In addition, each object is equipped with a caption and a 3D Gaussian Splat reconstruction. We train several large 3D models on MVImgNet, CO3Dv2, and uCO3D and obtain superior results using the latter, showing that uCO3D is better for learning applications.
PDF132January 14, 2025