LiDAR 관점을 통한 지상 포인트 클라우드 분할을 위한 특징 강화 및 불확실성 인식 주석 파이프라인
Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation
October 8, 2025
저자: Fei Zhang, Rob Chancia, Josie Clapp, Amirhossein Hassanzadeh, Dimah Dera, Richard MacKenzie, Jan van Aardt
cs.AI
초록
지상 레이저 스캐닝(TLS) 포인트 클라우드의 정확한 의미론적 분할은 비용이 많이 드는 수동 주석 작업으로 인해 제한적이다. 본 연구에서는 구형 투영, 특징 강화, 앙상블 학습, 그리고 표적 주석을 통합하여 라벨링 작업을 줄이면서도 높은 정확도를 유지하는 반자동화된 불확실성 인식 파이프라인을 제안한다. 제안된 접근법은 3D 포인트를 2D 구형 그리드에 투영하고, 픽셀을 다중 소스 특징으로 강화하며, 분할 네트워크 앙상블을 학습시켜 의사 라벨과 불확실성 맵을 생성한다. 이때 불확실성 맵은 모호한 영역의 주석 작업을 안내한다. 2D 출력은 3D로 역투영되어, 2D 특징 맵, 3D 색상화된 포인트 클라우드, 그리고 컴팩트 가상 구체로 구성된 3단계 시각화 도구를 통해 신속한 분류와 검토자 안내를 지원하는 밀집 주석 포인트 클라우드를 생성한다. 이 파이프라인을 사용하여 맹그로브 숲을 위한 의미론적 분할 TLS 데이터셋인 Mangrove3D를 구축하였다. 또한 데이터 효율성과 특징 중요성을 평가하여 두 가지 핵심 질문에 답하고자 하였다: (1) 얼마나 많은 주석 데이터가 필요한가, (2) 어떤 특징이 가장 중요한가. 결과는 약 12개의 주석 스캔 이후 성능이 포화되고, 기하학적 특징이 가장 큰 기여를 하며, 9채널 스택이 거의 모든 판별력을 포착하며, 평균 교차 합집합(mIoU)이 약 0.76에서 정체기에 도달함을 보여준다. 마지막으로, ForestSemantic과 Semantic3D에 대한 교차 데이터셋 테스트를 통해 특징 강화 전략의 일반화를 확인하였다.
본 연구의 기여는 다음과 같다: (i) 시각화 도구를 포함한 견고한 불확실성 인식 TLS 주석 파이프라인; (ii) Mangrove3D 데이터셋; (iii) 데이터 효율성과 특징 중요성에 대한 실증적 지침. 이를 통해 생태 모니터링 및 그 이상을 위한 TLS 포인트 클라우드의 확장 가능한 고품질 분할이 가능해졌다. 데이터셋과 처리 스크립트는 https://fz-rit.github.io/through-the-lidars-eye/에서 공개적으로 이용 가능하다.
English
Accurate semantic segmentation of terrestrial laser scanning (TLS) point
clouds is limited by costly manual annotation. We propose a semi-automated,
uncertainty-aware pipeline that integrates spherical projection, feature
enrichment, ensemble learning, and targeted annotation to reduce labeling
effort, while sustaining high accuracy. Our approach projects 3D points to a 2D
spherical grid, enriches pixels with multi-source features, and trains an
ensemble of segmentation networks to produce pseudo-labels and uncertainty
maps, the latter guiding annotation of ambiguous regions. The 2D outputs are
back-projected to 3D, yielding densely annotated point clouds supported by a
three-tier visualization suite (2D feature maps, 3D colorized point clouds, and
compact virtual spheres) for rapid triage and reviewer guidance. Using this
pipeline, we build Mangrove3D, a semantic segmentation TLS dataset for mangrove
forests. We further evaluate data efficiency and feature importance to address
two key questions: (1) how much annotated data are needed and (2) which
features matter most. Results show that performance saturates after ~12
annotated scans, geometric features contribute the most, and compact
nine-channel stacks capture nearly all discriminative power, with the mean
Intersection over Union (mIoU) plateauing at around 0.76. Finally, we confirm
the generalization of our feature-enrichment strategy through cross-dataset
tests on ForestSemantic and Semantic3D.
Our contributions include: (i) a robust, uncertainty-aware TLS annotation
pipeline with visualization tools; (ii) the Mangrove3D dataset; and (iii)
empirical guidance on data efficiency and feature importance, thus enabling
scalable, high-quality segmentation of TLS point clouds for ecological
monitoring and beyond. The dataset and processing scripts are publicly
available at https://fz-rit.github.io/through-the-lidars-eye/.