Multiview Point Cloud Registratie via Optimalisatie in een Autoencoder Latente Ruimte
Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space
April 30, 2025
Auteurs: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI
Samenvatting
Puntwolk-rigide registratie is een fundamenteel probleem in 3D-computervisie. In het multiview-geval streven we ernaar een set van 6D-posities te vinden om een set objecten uit te lijnen. Methoden gebaseerd op paarsgewijze registratie vertrouwen op een daaropvolgend synchronisatie-algoritme, wat ze slecht schaalbaar maakt met het aantal views. Generatieve benaderingen overkomen deze beperking, maar zijn gebaseerd op Gaussische Mengselmodellen en gebruiken een Expectation-Maximization-algoritme. Daardoor zijn ze niet goed geschikt om grote transformaties te verwerken. Bovendien kunnen de meeste bestaande methoden geen hoge niveaus van degradatie aan. In dit artikel introduceren we POLAR (POint cloud LAtent Registration), een multiview-registratiemethode die efficiënt omgaat met een groot aantal views, terwijl ze robuust is tegen een hoog niveau van degradatie en grote initiële hoeken. Om dit te bereiken, vertalen we het registratieprobleem naar de latente ruimte van een vooraf getrainde auto-encoder, ontwerpen we een verliesfunctie die degradatie in acht neemt, en ontwikkelen we een efficiënte multistart-optimalisatiestrategie. Onze voorgestelde methode overtreft aanzienlijk de state-of-the-art benaderingen op synthetische en echte data. POLAR is beschikbaar op github.com/pypolar/polar of als een standalone pakket dat kan worden geïnstalleerd met pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer
vision. In the multiview case, we aim to find a set of 6D poses to align a set
of objects. Methods based on pairwise registration rely on a subsequent
synchronization algorithm, which makes them poorly scalable with the number of
views. Generative approaches overcome this limitation, but are based on
Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence,
they are not well suited to handle large transformations. Moreover, most
existing methods cannot handle high levels of degradations. In this paper, we
introduce POLAR (POint cloud LAtent Registration), a multiview registration
method able to efficiently deal with a large number of views, while being
robust to a high level of degradations and large initial angles. To achieve
this, we transpose the registration problem into the latent space of a
pretrained autoencoder, design a loss taking degradations into account, and
develop an efficient multistart optimization strategy. Our proposed method
significantly outperforms state-of-the-art approaches on synthetic and real
data. POLAR is available at github.com/pypolar/polar or as a standalone package
which can be installed with pip install polaregistration.