ChatPaper.aiChatPaper

Registrazione di Nuvole di Punti Multivista tramite Ottimizzazione nello Spazio Latente di un Autoencoder

Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space

April 30, 2025
Autori: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI

Abstract

La registrazione rigida di nuvole di punti è un problema fondamentale nella visione artificiale 3D. Nel caso multivista, l'obiettivo è trovare un insieme di pose 6D per allineare un insieme di oggetti. I metodi basati sulla registrazione a coppie si affidano a un successivo algoritmo di sincronizzazione, il che li rende poco scalabili con il numero di viste. Gli approcci generativi superano questa limitazione, ma si basano su modelli di mistura gaussiana e utilizzano un algoritmo Expectation-Maximization. Di conseguenza, non sono adatti a gestire grandi trasformazioni. Inoltre, la maggior parte dei metodi esistenti non può gestire alti livelli di degradazione. In questo articolo, introduciamo POLAR (POint cloud LAtent Registration), un metodo di registrazione multivista in grado di gestire in modo efficiente un gran numero di viste, pur essendo robusto a un alto livello di degradazioni e a grandi angoli iniziali. Per ottenere ciò, trasponiamo il problema di registrazione nello spazio latente di un autoencoder pre-addestrato, progettiamo una funzione di perdita che tiene conto delle degradazioni e sviluppiamo una strategia di ottimizzazione multistart efficiente. Il nostro metodo proposto supera significativamente gli approcci all'avanguardia su dati sintetici e reali. POLAR è disponibile su github.com/pypolar/polar o come pacchetto autonomo che può essere installato con pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.
PDF12May 12, 2025