ChatPaper.aiChatPaper

Enregistrement de nuages de points multivues par optimisation dans un espace latent d'autoencodeur

Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space

April 30, 2025
Auteurs: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI

Résumé

L’alignement rigide de nuages de points est un problème fondamental en vision par ordinateur 3D. Dans le cas multivue, nous cherchons à déterminer un ensemble de poses 6D pour aligner un ensemble d’objets. Les méthodes basées sur l’alignement par paires s’appuient sur un algorithme de synchronisation ultérieur, ce qui les rend peu évolutives avec le nombre de vues. Les approches génératives surmontent cette limitation, mais reposent sur des modèles de mélanges gaussiens et utilisent un algorithme d’espérance-maximisation. Par conséquent, elles ne sont pas bien adaptées pour gérer de grandes transformations. De plus, la plupart des méthodes existantes ne peuvent pas gérer des niveaux élevés de dégradations. Dans cet article, nous présentons POLAR (POint cloud LAtent Registration), une méthode d’alignement multivue capable de traiter efficacement un grand nombre de vues, tout en étant robuste à un niveau élevé de dégradations et à de grands angles initiaux. Pour y parvenir, nous transposons le problème d’alignement dans l’espace latent d’un autoencodeur préentraîné, concevons une fonction de coût prenant en compte les dégradations, et développons une stratégie d’optimisation multistart efficace. Notre méthode proposée surpasse significativement les approches de l’état de l’art sur des données synthétiques et réelles. POLAR est disponible sur github.com/pypolar/polar ou en tant que package autonome pouvant être installé avec pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.

Summary

AI-Generated Summary

PDF02May 12, 2025