Attraverso la prospettiva del LiDAR: una pipeline di annotazione arricchita di caratteristiche e consapevole dell'incertezza per la segmentazione di nuvole di punti terrestri

Abstract

La segmentazione semantica accurata delle nuvole di punti ottenute tramite scansione laser terrestre (TLS) è limitata dai costosi processi di annotazione manuale. Proponiamo una pipeline semi-automatizzata e consapevole dell'incertezza che integra proiezione sferica, arricchimento delle caratteristiche, apprendimento ensemble e annotazione mirata per ridurre lo sforzo di etichettatura, mantenendo al contempo un'elevata accuratezza. Il nostro approccio proietta i punti 3D su una griglia sferica 2D, arricchisce i pixel con caratteristiche provenienti da più fonti e addestra un insieme di reti di segmentazione per produrre pseudo-etichette e mappe di incertezza, quest'ultime utilizzate per guidare l'annotazione delle regioni ambigue. Gli output 2D vengono riproiettati in 3D, producendo nuvole di punti densamente annotate supportate da una suite di visualizzazione a tre livelli (mappe delle caratteristiche 2D, nuvole di punti colorate 3D e sfere virtuali compatte) per una rapida triage e guida del revisore. Utilizzando questa pipeline, abbiamo creato Mangrove3D, un dataset di segmentazione semantica TLS per le foreste di mangrovie. Abbiamo inoltre valutato l'efficienza dei dati e l'importanza delle caratteristiche per rispondere a due domande chiave: (1) quanti dati annotati sono necessari e (2) quali caratteristiche sono più rilevanti. I risultati mostrano che le prestazioni si saturano dopo circa 12 scansioni annotate, le caratteristiche geometriche contribuiscono maggiormente e stack compatti di nove canali catturano quasi tutto il potere discriminativo, con l'Intersection over Union media (mIoU) che si stabilizza intorno a 0.76. Infine, confermiamo la generalizzazione della nostra strategia di arricchimento delle caratteristiche attraverso test cross-dataset su ForestSemantic e Semantic3D. Le nostre contribuzioni includono: (i) una pipeline robusta e consapevole dell'incertezza per l'annotazione TLS con strumenti di visualizzazione; (ii) il dataset Mangrove3D; e (iii) linee guida empiriche sull'efficienza dei dati e l'importanza delle caratteristiche, consentendo così una segmentazione scalabile e di alta qualità delle nuvole di punti TLS per il monitoraggio ecologico e oltre. Il dataset e gli script di elaborazione sono disponibili pubblicamente all'indirizzo https://fz-rit.github.io/through-the-lidars-eye/.

English

Accurate semantic segmentation of terrestrial laser scanning (TLS) point clouds is limited by costly manual annotation. We propose a semi-automated, uncertainty-aware pipeline that integrates spherical projection, feature enrichment, ensemble learning, and targeted annotation to reduce labeling effort, while sustaining high accuracy. Our approach projects 3D points to a 2D spherical grid, enriches pixels with multi-source features, and trains an ensemble of segmentation networks to produce pseudo-labels and uncertainty maps, the latter guiding annotation of ambiguous regions. The 2D outputs are back-projected to 3D, yielding densely annotated point clouds supported by a three-tier visualization suite (2D feature maps, 3D colorized point clouds, and compact virtual spheres) for rapid triage and reviewer guidance. Using this pipeline, we build Mangrove3D, a semantic segmentation TLS dataset for mangrove forests. We further evaluate data efficiency and feature importance to address two key questions: (1) how much annotated data are needed and (2) which features matter most. Results show that performance saturates after ~12 annotated scans, geometric features contribute the most, and compact nine-channel stacks capture nearly all discriminative power, with the mean Intersection over Union (mIoU) plateauing at around 0.76. Finally, we confirm the generalization of our feature-enrichment strategy through cross-dataset tests on ForestSemantic and Semantic3D. Our contributions include: (i) a robust, uncertainty-aware TLS annotation pipeline with visualization tools; (ii) the Mangrove3D dataset; and (iii) empirical guidance on data efficiency and feature importance, thus enabling scalable, high-quality segmentation of TLS point clouds for ecological monitoring and beyond. The dataset and processing scripts are publicly available at https://fz-rit.github.io/through-the-lidars-eye/.

Attraverso la prospettiva del LiDAR: una pipeline di annotazione arricchita di caratteristiche e consapevole dell'incertezza per la segmentazione di nuvole di punti terrestri

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation

Abstract

Support