P3-SAM: Native 3D Onderdeelsegmentatie
P3-SAM: Native 3D Part Segmentation
September 8, 2025
Auteurs: Changfeng Ma, Yang Li, Xinhao Yan, Jiachen Xu, Yunhan Yang, Chunshi Wang, Zibo Zhao, Yanwen Guo, Zhuo Chen, Chunchao Guo
cs.AI
Samenvatting
Het segmenteren van 3D-assets in hun samenstellende onderdelen is cruciaal voor het verbeteren van 3D-begrip, het vergemakkelijken van modelhergebruik en het ondersteunen van diverse toepassingen zoals onderdeelgeneratie. Huidige methoden hebben echter beperkingen, zoals een gebrek aan robuustheid bij het omgaan met complexe objecten en kunnen het proces niet volledig automatiseren. In dit artikel stellen we een native 3D punt-promptbaar onderdeelsegmentatiemodel voor, genaamd P3-SAM, dat is ontworpen om de segmentatie van elk 3D-object in componenten volledig te automatiseren. Geïnspireerd door SAM bestaat P3-SAM uit een feature-extractor, meerdere segmentatiekoppen en een IoU-voorspeller, wat interactieve segmentatie voor gebruikers mogelijk maakt. We stellen ook een algoritme voor om automatisch maskers te selecteren en samen te voegen die door ons model zijn voorspeld voor onderdeelinstantiesegmentatie. Ons model is getraind op een nieuw gebouwde dataset die bijna 3,7 miljoen modellen bevat met redelijke segmentatielabels. Vergelijkingen tonen aan dat onze methode nauwkeurige segmentatieresultaten en sterke robuustheid op elk complex object bereikt, wat resulteert in state-of-the-art prestaties. Onze code zal binnenkort worden vrijgegeven.
English
Segmenting 3D assets into their constituent parts is crucial for enhancing 3D
understanding, facilitating model reuse, and supporting various applications
such as part generation. However, current methods face limitations such as poor
robustness when dealing with complex objects and cannot fully automate the
process. In this paper, we propose a native 3D point-promptable part
segmentation model termed P3-SAM, designed to fully automate the segmentation
of any 3D objects into components. Inspired by SAM, P3-SAM consists of a
feature extractor, multiple segmentation heads, and an IoU predictor, enabling
interactive segmentation for users. We also propose an algorithm to
automatically select and merge masks predicted by our model for part instance
segmentation. Our model is trained on a newly built dataset containing nearly
3.7 million models with reasonable segmentation labels. Comparisons show that
our method achieves precise segmentation results and strong robustness on any
complex objects, attaining state-of-the-art performance. Our code will be
released soon.