ChatPaper.aiChatPaper

Multiview-Punktwolkenregistrierung durch Optimierung in einem Autoencoder-Latenzraum

Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space

April 30, 2025
Autoren: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI

Zusammenfassung

Die starre Registrierung von Punktwolken ist ein grundlegendes Problem in der 3D-Computervision. Im multiview-Fall besteht das Ziel darin, eine Menge von 6D-Posen zu finden, um eine Menge von Objekten auszurichten. Methoden, die auf paarweiser Registrierung basieren, verlassen sich auf einen nachgeschalteten Synchronisationsalgorithmus, was sie schlecht skalierbar mit der Anzahl der Ansichten macht. Generative Ansätze überwinden diese Einschränkung, basieren jedoch auf Gaußschen Mischmodellen und verwenden einen Expectation-Maximization-Algorithmus. Daher sind sie nicht gut geeignet, um große Transformationen zu handhaben. Darüber hinaus können die meisten bestehenden Methoden keine hohen Degradationsgrade bewältigen. In diesem Artikel stellen wir POLAR (POint cloud LAtent Registration) vor, eine multiview-Registrierungsmethode, die effizient mit einer großen Anzahl von Ansichten umgehen kann, während sie robust gegenüber einem hohen Grad an Degradationen und großen Anfangsdrehwinkeln ist. Um dies zu erreichen, übertragen wir das Registrierungsproblem in den latenten Raum eines vortrainierten Autoencoders, entwerfen eine Verlustfunktion, die Degradationen berücksichtigt, und entwickeln eine effiziente Multistart-Optimierungsstrategie. Unsere vorgeschlagene Methode übertrifft deutlich den Stand der Technik auf synthetischen und realen Daten. POLAR ist unter github.com/pypolar/polar verfügbar oder als eigenständiges Paket, das mit pip install polaregistration installiert werden kann.
English
Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.

Summary

AI-Generated Summary

PDF02May 12, 2025