P3-SAM: Segmentación Nativa de Partes en 3D
P3-SAM: Native 3D Part Segmentation
September 8, 2025
Autores: Changfeng Ma, Yang Li, Xinhao Yan, Jiachen Xu, Yunhan Yang, Chunshi Wang, Zibo Zhao, Yanwen Guo, Zhuo Chen, Chunchao Guo
cs.AI
Resumen
Segmentar activos 3D en sus partes constituyentes es crucial para mejorar la comprensión 3D, facilitar la reutilización de modelos y respaldar diversas aplicaciones, como la generación de partes. Sin embargo, los métodos actuales enfrentan limitaciones, como una baja robustez al tratar con objetos complejos y la incapacidad de automatizar completamente el proceso. En este artículo, proponemos un modelo nativo de segmentación de partes mediante puntos 3D, denominado P3-SAM, diseñado para automatizar completamente la segmentación de cualquier objeto 3D en sus componentes. Inspirado en SAM, P3-SAM consta de un extractor de características, múltiples cabezales de segmentación y un predictor de IoU, lo que permite la segmentación interactiva para los usuarios. También proponemos un algoritmo para seleccionar y fusionar automáticamente las máscaras predichas por nuestro modelo para la segmentación de instancias de partes. Nuestro modelo se entrena en un nuevo conjunto de datos que contiene casi 3.7 millones de modelos con etiquetas de segmentación razonables. Las comparaciones muestran que nuestro método logra resultados de segmentación precisos y una fuerte robustez en cualquier objeto complejo, alcanzando un rendimiento de vanguardia. Nuestro código se lanzará pronto.
English
Segmenting 3D assets into their constituent parts is crucial for enhancing 3D
understanding, facilitating model reuse, and supporting various applications
such as part generation. However, current methods face limitations such as poor
robustness when dealing with complex objects and cannot fully automate the
process. In this paper, we propose a native 3D point-promptable part
segmentation model termed P3-SAM, designed to fully automate the segmentation
of any 3D objects into components. Inspired by SAM, P3-SAM consists of a
feature extractor, multiple segmentation heads, and an IoU predictor, enabling
interactive segmentation for users. We also propose an algorithm to
automatically select and merge masks predicted by our model for part instance
segmentation. Our model is trained on a newly built dataset containing nearly
3.7 million models with reasonable segmentation labels. Comparisons show that
our method achieves precise segmentation results and strong robustness on any
complex objects, attaining state-of-the-art performance. Our code will be
released soon.