Ghost-FWL: 유령 탐지 및 제거를 위한 대규모 완전파형 LiDAR 데이터셋
Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal
March 30, 2026
저자: Kazuma Ikeda, Ryosei Hara, Rokuto Nagata, Ozora Sako. Zihao Ding, Takahiro Kado, Ibuki Fujioka, Taro Beppu, Mariko Isogawa, Kentaro Yoshioka
cs.AI
초록
LiDAR는 자율 주행, 로봇 공학, 스마트 시티 응용 분야에서 필수적인 센싱 방식으로 자리 잡았습니다. 그러나 유리 및 반사 표면에서의 다중 경계 레이저 반사로 인해 발생하는 오반사점(ghost points 또는 ghosts)은 3D 매핑 및 위치 추정 정확도를 심각하게 저하시킵니다. 기존 오반사점 제거 방법은 조밀한 포인트 클라우드에서의 기하학적 일관성에 의존하여, 모바일 LiDAR의 희소하고 동적인 데이터에서는 효과를 발휘하지 못합니다. 본 연구에서는 단순한 피크 거리뿐만 아니라 완전한 시간적 강도 프로파일을 포착하여 모바일 환경에서 오반사점과 실제 반사점을 구분하는 중요한 단서를 제공하는 전형파 LiDAR(Full-waveform LiDAR, FWL)를 활용하여 이 문제를 해결합니다. 이는 새로운 과제이므로, 우리는 오반사점 탐지 및 제거를 위한 최초이자 가장 큰 주석 처리된 모바일 FWL 데이터셋인 Ghost-FWL을 제시합니다. Ghost-FWL은 10가지 다양한 장면에서 총 24K 프레임, 75억 개의 피크 수준 주석으로 구성되어 있으며, 이는 기존 주석 처리된 FWL 데이터셋보다 100배 큰 규모입니다. 이러한 대규모 데이터셋을 바탕으로 우리는 오반사점 탐지를 위한 FWL 기반 기준 모델을 구축하고, FWL 데이터에 대한 효율적인 자기 지도 표현 학습을 위한 마스크드 오토인코더(Masked Autoencoder)인 FWL-MAE를 제안합니다. 실험 결과, 우리의 기준 모델이 오반사점 제거 정확도에서 기존 방법들을 능가하며, 우리의 오반사점 제거 기술이 LiDAR 기반 SLAM(궤적 오류 66% 감소) 및 3D 객체 탐지(위양성 50배 감소)와 같은 다운스트림 작업을 더욱 향상시키는 것으로 나타났습니다. 데이터셋과 코드는 공개되어 있으며 프로젝트 페이지(https://keio-csg.github.io/Ghost-FWL)를 통해 확인할 수 있습니다.
English
LiDAR has become an essential sensing modality in autonomous driving, robotics, and smart-city applications. However, ghost points (or ghosts), which are false reflections caused by multi-path laser returns from glass and reflective surfaces, severely degrade 3D mapping and localization accuracy. Prior ghost removal relies on geometric consistency in dense point clouds, failing on mobile LiDAR's sparse, dynamic data. We address this by exploiting full-waveform LiDAR (FWL), which captures complete temporal intensity profiles rather than just peak distances, providing crucial cues for distinguishing ghosts from genuine reflections in mobile scenarios. As this is a new task, we present Ghost-FWL, the first and largest annotated mobile FWL dataset for ghost detection and removal. Ghost-FWL comprises 24K frames across 10 diverse scenes with 7.5 billion peak-level annotations, which is 100x larger than existing annotated FWL datasets. Benefiting from this large-scale dataset, we establish a FWL-based baseline model for ghost detection and propose FWL-MAE, a masked autoencoder for efficient self-supervised representation learning on FWL data. Experiments show that our baseline outperforms existing methods in ghost removal accuracy, and our ghost removal further enhances downstream tasks such as LiDAR-based SLAM (66% trajectory error reduction) and 3D object detection (50x false positive reduction). The dataset and code is publicly available and can be accessed via the project page: https://keio-csg.github.io/Ghost-FWL