ChatPaper.aiChatPaper

Registro de Nubes de Puntos Multivista mediante Optimización en un Espacio Latente de Autoencoder

Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space

April 30, 2025
Autores: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI

Resumen

El registro rígido de nubes de puntos es un problema fundamental en la visión por computadora 3D. En el caso multivista, buscamos encontrar un conjunto de poses 6D para alinear un conjunto de objetos. Los métodos basados en registro por pares dependen de un algoritmo de sincronización posterior, lo que los hace poco escalables con el número de vistas. Los enfoques generativos superan esta limitación, pero se basan en modelos de mezcla gaussiana y utilizan un algoritmo de Expectation-Maximization. Por lo tanto, no son adecuados para manejar transformaciones grandes. Además, la mayoría de los métodos existentes no pueden manejar altos niveles de degradaciones. En este artículo, presentamos POLAR (POint cloud LAtent Registration), un método de registro multivista capaz de manejar eficientemente un gran número de vistas, al mismo tiempo que es robusto frente a un alto nivel de degradaciones y ángulos iniciales grandes. Para lograr esto, trasladamos el problema de registro al espacio latente de un autoencoder preentrenado, diseñamos una función de pérdida que tiene en cuenta las degradaciones y desarrollamos una estrategia de optimización multinicio eficiente. Nuestro método propuesto supera significativamente a los enfoques más avanzados en datos sintéticos y reales. POLAR está disponible en github.com/pypolar/polar o como un paquete independiente que puede instalarse con pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.

Summary

AI-Generated Summary

PDF02May 12, 2025