Многовидовая регистрация облаков точек через оптимизацию в латентном пространстве автоэнкодера
Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space
April 30, 2025
Авторы: Luc Vedrenne, Sylvain Faisan, Denis Fortun
cs.AI
Аннотация
Жесткая регистрация облаков точек является фундаментальной задачей в трехмерном компьютерном зрении. В случае многовидового подхода мы стремимся найти набор 6D поз для выравнивания множества объектов. Методы, основанные на попарной регистрации, полагаются на последующий алгоритм синхронизации, что делает их плохо масштабируемыми с увеличением числа видов. Генеративные подходы преодолевают это ограничение, но основаны на моделях гауссовых смесей и используют алгоритм максимизации ожидания (EM). Следовательно, они не подходят для обработки больших преобразований. Более того, большинство существующих методов не справляются с высокими уровнями деградации. В данной статье мы представляем POLAR (POint cloud LAtent Registration) — метод многовидовой регистрации, способный эффективно работать с большим количеством видов, оставаясь устойчивым к высоким уровням деградации и большим начальным углам. Для достижения этого мы переносим задачу регистрации в латентное пространство предобученного автокодировщика, разрабатываем функцию потерь, учитывающую деградации, и создаем эффективную стратегию многозапусковой оптимизации. Наш предложенный метод значительно превосходит современные подходы на синтетических и реальных данных. POLAR доступен на github.com/pypolar/polar или в виде отдельного пакета, который можно установить с помощью pip install polaregistration.
English
Point cloud rigid registration is a fundamental problem in 3D computer
vision. In the multiview case, we aim to find a set of 6D poses to align a set
of objects. Methods based on pairwise registration rely on a subsequent
synchronization algorithm, which makes them poorly scalable with the number of
views. Generative approaches overcome this limitation, but are based on
Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence,
they are not well suited to handle large transformations. Moreover, most
existing methods cannot handle high levels of degradations. In this paper, we
introduce POLAR (POint cloud LAtent Registration), a multiview registration
method able to efficiently deal with a large number of views, while being
robust to a high level of degradations and large initial angles. To achieve
this, we transpose the registration problem into the latent space of a
pretrained autoencoder, design a loss taking degradations into account, and
develop an efficient multistart optimization strategy. Our proposed method
significantly outperforms state-of-the-art approaches on synthetic and real
data. POLAR is available at github.com/pypolar/polar or as a standalone package
which can be installed with pip install polaregistration.Summary
AI-Generated Summary