ChatPaper.aiChatPaper

Registro de Nuvem de Pontos Multivista via Otimização no Espaço Latente de um Autoencoder

Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space

April 30, 2025
Autores: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI

Resumo

O registro rígido de nuvens de pontos é um problema fundamental na visão computacional 3D. No caso multivista, buscamos encontrar um conjunto de poses 6D para alinhar um conjunto de objetos. Métodos baseados em registro par a par dependem de um algoritmo de sincronização subsequente, o que os torna pouco escaláveis com o número de vistas. Abordagens generativas superam essa limitação, mas são baseadas em Modelos de Mistura de Gaussianas e utilizam um algoritmo de Expectation-Maximization. Portanto, não são bem adequadas para lidar com grandes transformações. Além disso, a maioria dos métodos existentes não consegue lidar com altos níveis de degradação. Neste artigo, introduzimos o POLAR (POint cloud LAtent Registration), um método de registro multivista capaz de lidar eficientemente com um grande número de vistas, ao mesmo tempo em que é robusto a um alto nível de degradações e ângulos iniciais grandes. Para alcançar isso, transpusemos o problema de registro para o espaço latente de um autoencoder pré-treinado, projetamos uma função de perda que leva em consideração as degradações e desenvolvemos uma estratégia de otimização multistart eficiente. Nosso método proposto supera significativamente as abordagens state-of-the-art em dados sintéticos e reais. O POLAR está disponível em github.com/pypolar/polar ou como um pacote independente que pode ser instalado com pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.
PDF12February 7, 2026