LiDARの視点から:地上点群セグメンテーションのための特徴豊富で不確実性を考慮したアノテーションパイプライン
Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation
October 8, 2025
著者: Fei Zhang, Rob Chancia, Josie Clapp, Amirhossein Hassanzadeh, Dimah Dera, Richard MacKenzie, Jan van Aardt
cs.AI
要旨
地上型レーザースキャン(TLS)点群の正確なセマンティックセグメンテーションは、高コストな手動アノテーションによって制限されています。本研究では、球面投影、特徴量拡張、アンサンブル学習、およびターゲットアノテーションを統合した半自動化された不確実性認識パイプラインを提案し、ラベリング作業を削減しながら高い精度を維持します。本手法では、3D点群を2D球面グリッドに投影し、ピクセルに多様な特徴量を付加し、セグメンテーションネットワークのアンサンブルを訓練して擬似ラベルと不確実性マップを生成します。不確実性マップは、曖昧な領域のアノテーションをガイドします。2D出力は3Dに逆投影され、3層の可視化スイート(2D特徴マップ、3Dカラー化点群、コンパクトな仮想球体)をサポートした密なアノテーション付き点群を生成し、迅速なトリアージとレビュアーのガイドを可能にします。このパイプラインを使用して、マングローブ林のセマンティックセグメンテーションTLSデータセットであるMangrove3Dを構築しました。さらに、データ効率と特徴量の重要性を評価し、2つの重要な質問に答えます:(1)どれだけのアノテーションデータが必要か、(2)どの特徴量が最も重要か。結果は、約12回のアノテーションスキャン後に性能が飽和し、幾何学的特徴量が最も寄与し、コンパクトな9チャネルのスタックがほぼ全ての識別力を捉え、平均IoU(mIoU)が約0.76で頭打ちになることを示しています。最後に、ForestSemanticとSemantic3Dでのクロスデータセットテストを通じて、特徴量拡張戦略の汎用性を確認しました。
本研究の貢献は以下の通りです:(i)可視化ツールを備えた堅牢な不確実性認識TLSアノテーションパイプライン、(ii)Mangrove3Dデータセット、(iii)データ効率と特徴量の重要性に関する実証的ガイダンス。これにより、生態モニタリングを超えたTLS点群のスケーラブルで高品質なセグメンテーションが可能になります。データセットと処理スクリプトは、https://fz-rit.github.io/through-the-lidars-eye/ で公開されています。
English
Accurate semantic segmentation of terrestrial laser scanning (TLS) point
clouds is limited by costly manual annotation. We propose a semi-automated,
uncertainty-aware pipeline that integrates spherical projection, feature
enrichment, ensemble learning, and targeted annotation to reduce labeling
effort, while sustaining high accuracy. Our approach projects 3D points to a 2D
spherical grid, enriches pixels with multi-source features, and trains an
ensemble of segmentation networks to produce pseudo-labels and uncertainty
maps, the latter guiding annotation of ambiguous regions. The 2D outputs are
back-projected to 3D, yielding densely annotated point clouds supported by a
three-tier visualization suite (2D feature maps, 3D colorized point clouds, and
compact virtual spheres) for rapid triage and reviewer guidance. Using this
pipeline, we build Mangrove3D, a semantic segmentation TLS dataset for mangrove
forests. We further evaluate data efficiency and feature importance to address
two key questions: (1) how much annotated data are needed and (2) which
features matter most. Results show that performance saturates after ~12
annotated scans, geometric features contribute the most, and compact
nine-channel stacks capture nearly all discriminative power, with the mean
Intersection over Union (mIoU) plateauing at around 0.76. Finally, we confirm
the generalization of our feature-enrichment strategy through cross-dataset
tests on ForestSemantic and Semantic3D.
  Our contributions include: (i) a robust, uncertainty-aware TLS annotation
pipeline with visualization tools; (ii) the Mangrove3D dataset; and (iii)
empirical guidance on data efficiency and feature importance, thus enabling
scalable, high-quality segmentation of TLS point clouds for ecological
monitoring and beyond. The dataset and processing scripts are publicly
available at https://fz-rit.github.io/through-the-lidars-eye/.