P3-SAM: Segmentazione nativa di parti in 3D
P3-SAM: Native 3D Part Segmentation
September 8, 2025
Autori: Changfeng Ma, Yang Li, Xinhao Yan, Jiachen Xu, Yunhan Yang, Chunshi Wang, Zibo Zhao, Yanwen Guo, Zhuo Chen, Chunchao Guo
cs.AI
Abstract
La segmentazione di asset 3D nelle loro parti costituenti è cruciale per migliorare la comprensione 3D, facilitare il riutilizzo dei modelli e supportare varie applicazioni come la generazione di parti. Tuttavia, i metodi attuali presentano limitazioni, come una scarsa robustezza nel gestire oggetti complessi e l’incapacità di automatizzare completamente il processo. In questo articolo, proponiamo un modello nativo di segmentazione delle parti basato su prompt di punti 3D, denominato P3-SAM, progettato per automatizzare completamente la segmentazione di qualsiasi oggetto 3D in componenti. Ispirato da SAM, P3-SAM è composto da un estrattore di feature, multiple teste di segmentazione e un predittore di IoU, consentendo una segmentazione interattiva per gli utenti. Proponiamo inoltre un algoritmo per selezionare e unire automaticamente le maschere predette dal nostro modello per la segmentazione delle istanze delle parti. Il nostro modello è addestrato su un nuovo dataset contenente quasi 3,7 milioni di modelli con etichette di segmentazione ragionevoli. I confronti dimostrano che il nostro metodo ottiene risultati di segmentazione precisi e una forte robustezza su qualsiasi oggetto complesso, raggiungendo prestazioni all'avanguardia. Il nostro codice sarà rilasciato a breve.
English
Segmenting 3D assets into their constituent parts is crucial for enhancing 3D
understanding, facilitating model reuse, and supporting various applications
such as part generation. However, current methods face limitations such as poor
robustness when dealing with complex objects and cannot fully automate the
process. In this paper, we propose a native 3D point-promptable part
segmentation model termed P3-SAM, designed to fully automate the segmentation
of any 3D objects into components. Inspired by SAM, P3-SAM consists of a
feature extractor, multiple segmentation heads, and an IoU predictor, enabling
interactive segmentation for users. We also propose an algorithm to
automatically select and merge masks predicted by our model for part instance
segmentation. Our model is trained on a newly built dataset containing nearly
3.7 million models with reasonable segmentation labels. Comparisons show that
our method achieves precise segmentation results and strong robustness on any
complex objects, attaining state-of-the-art performance. Our code will be
released soon.