ChatPaper.aiChatPaper

SlotLifter: Sollevamento delle Caratteristiche Guidato da Slot per l'Apprendimento di Campi di Radianza Centrati sugli Oggetti

SlotLifter: Slot-guided Feature Lifting for Learning Object-centric Radiance Fields

August 13, 2024
Autori: Yu Liu, Baoxiong Jia, Yixin Chen, Siyuan Huang
cs.AI

Abstract

La capacità di distillare astrazioni centrate sugli oggetti da scene visive complesse è alla base della generalizzazione di livello umano. Nonostante i significativi progressi nei metodi di apprendimento centrati sugli oggetti, l'apprendimento di rappresentazioni centrate sugli oggetti nel mondo fisico 3D rimane una sfida cruciale. In questo lavoro, proponiamo SlotLifter, un innovativo modello di radianza centrato sugli oggetti che affronta congiuntamente la ricostruzione e la scomposizione della scene tramite il sollevamento di caratteristiche guidato da slot. Tale design unisce rappresentazioni di apprendimento centrate sugli oggetti e metodi di rendering basati su immagini, offrendo prestazioni all'avanguardia nella scomposizione delle scene e nella sintesi di nuove viste su quattro dataset sintetici impegnativi e quattro dataset real-world complessi, superando di gran lunga i metodi esistenti di apprendimento 3D centrati sugli oggetti. Attraverso studi ablativi estesi, dimostriamo l'efficacia dei design in SlotLifter, rivelando intuizioni chiave per potenziali direzioni future.
English
The ability to distill object-centric abstractions from intricate visual scenes underpins human-level generalization. Despite the significant progress in object-centric learning methods, learning object-centric representations in the 3D physical world remains a crucial challenge. In this work, we propose SlotLifter, a novel object-centric radiance model addressing scene reconstruction and decomposition jointly via slot-guided feature lifting. Such a design unites object-centric learning representations and image-based rendering methods, offering state-of-the-art performance in scene decomposition and novel-view synthesis on four challenging synthetic and four complex real-world datasets, outperforming existing 3D object-centric learning methods by a large margin. Through extensive ablative studies, we showcase the efficacy of designs in SlotLifter, revealing key insights for potential future directions.
PDF152November 28, 2024