P3-SAM: Segmentação Nativa de Partes 3D
P3-SAM: Native 3D Part Segmentation
September 8, 2025
Autores: Changfeng Ma, Yang Li, Xinhao Yan, Jiachen Xu, Yunhan Yang, Chunshi Wang, Zibo Zhao, Yanwen Guo, Zhuo Chen, Chunchao Guo
cs.AI
Resumo
Segmentar ativos 3D em suas partes constituintes é crucial para aprimorar a compreensão 3D, facilitar a reutilização de modelos e suportar diversas aplicações, como a geração de partes. No entanto, os métodos atuais enfrentam limitações, como baixa robustez ao lidar com objetos complexos e a incapacidade de automatizar completamente o processo. Neste artigo, propomos um modelo nativo de segmentação de partes em 3D acionável por pontos, denominado P3-SAM, projetado para automatizar totalmente a segmentação de qualquer objeto 3D em componentes. Inspirado pelo SAM, o P3-SAM consiste em um extrator de características, múltiplas cabeças de segmentação e um preditor de IoU, permitindo a segmentação interativa para os usuários. Também propomos um algoritmo para selecionar e mesclar automaticamente as máscaras previstas pelo nosso modelo para a segmentação de instâncias de partes. Nosso modelo é treinado em um novo conjunto de dados contendo quase 3,7 milhões de modelos com rótulos de segmentação razoáveis. Comparações mostram que nosso método alcança resultados de segmentação precisos e forte robustez em qualquer objeto complexo, atingindo desempenho de ponta. Nosso código será liberado em breve.
English
Segmenting 3D assets into their constituent parts is crucial for enhancing 3D
understanding, facilitating model reuse, and supporting various applications
such as part generation. However, current methods face limitations such as poor
robustness when dealing with complex objects and cannot fully automate the
process. In this paper, we propose a native 3D point-promptable part
segmentation model termed P3-SAM, designed to fully automate the segmentation
of any 3D objects into components. Inspired by SAM, P3-SAM consists of a
feature extractor, multiple segmentation heads, and an IoU predictor, enabling
interactive segmentation for users. We also propose an algorithm to
automatically select and merge masks predicted by our model for part instance
segmentation. Our model is trained on a newly built dataset containing nearly
3.7 million models with reasonable segmentation labels. Comparisons show that
our method achieves precise segmentation results and strong robustness on any
complex objects, attaining state-of-the-art performance. Our code will be
released soon.