Ghost-FWL: Un dataset su larga scala di LiDAR a onda completa per il rilevamento e la rimozione di artefatti fantasma
Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal
March 30, 2026
Autori: Kazuma Ikeda, Ryosei Hara, Rokuto Nagata, Ozora Sako. Zihao Ding, Takahiro Kado, Ibuki Fujioka, Taro Beppu, Mariko Isogawa, Kentaro Yoshioka
cs.AI
Abstract
Il LiDAR è diventato una modalità di rilevamento essenziale per la guida autonoma, la robotica e le applicazioni di smart city. Tuttavia, i punti fantasma (o ghost), ovvero falsi riflessi causati da rimbalzi laser multi-percorso su superfici di vetro e riflettenti, degradano gravemente l'accuratezza della mappatura e della localizzazione 3D. I precedenti metodi di rimozione dei ghost si basano sulla consistenza geometrica in nuvole di punti dense, fallendo sui dati dinamici e sparsi del LiDAR mobile. Noi affrontiamo questo problema sfruttando il LiDAR a forma d'onda completa (FWL), che cattura i profili di intensità temporali completi, e non solo le distanze di picco, fornendo indizi cruciali per distinguere i ghost dai riflessi genuini in scenari mobili. Trattandosi di un compito nuovo, presentiamo Ghost-FWL, il primo e più grande dataset FWL mobile annotato per il rilevamento e la rimozione dei ghost. Ghost-FWL comprende 24.000 frame in 10 scenari diversi con 7,5 miliardi di annotazioni a livello di picco, risultando 100 volte più grande dei dataset FWL annotati esistenti. Grazie a questo dataset su larga scala, stabiliamo un modello di base basato su FWL per il rilevamento dei ghost e proponiamo FWL-MAE, un autoencoder mascherato per un efficiente apprendimento auto-supervisionato delle rappresentazioni sui dati FWL. Gli esperimenti dimostrano che il nostro modello di base supera i metodi esistenti in accuratezza di rimozione dei ghost, e la nostra rimozione dei ghost migliora ulteriormente compiti a valle come lo SLAM basato su LiDAR (riduzione del 66% dell'errore di traiettoria) e il rilevamento di oggetti 3D (riduzione di 50 volte dei falsi positivi). Il dataset e il codice sono pubblicamente disponibili e accessibili tramite la pagina del progetto: https://keio-csg.github.io/Ghost-FWL.
English
LiDAR has become an essential sensing modality in autonomous driving, robotics, and smart-city applications. However, ghost points (or ghosts), which are false reflections caused by multi-path laser returns from glass and reflective surfaces, severely degrade 3D mapping and localization accuracy. Prior ghost removal relies on geometric consistency in dense point clouds, failing on mobile LiDAR's sparse, dynamic data. We address this by exploiting full-waveform LiDAR (FWL), which captures complete temporal intensity profiles rather than just peak distances, providing crucial cues for distinguishing ghosts from genuine reflections in mobile scenarios. As this is a new task, we present Ghost-FWL, the first and largest annotated mobile FWL dataset for ghost detection and removal. Ghost-FWL comprises 24K frames across 10 diverse scenes with 7.5 billion peak-level annotations, which is 100x larger than existing annotated FWL datasets. Benefiting from this large-scale dataset, we establish a FWL-based baseline model for ghost detection and propose FWL-MAE, a masked autoencoder for efficient self-supervised representation learning on FWL data. Experiments show that our baseline outperforms existing methods in ghost removal accuracy, and our ghost removal further enhances downstream tasks such as LiDAR-based SLAM (66% trajectory error reduction) and 3D object detection (50x false positive reduction). The dataset and code is publicly available and can be accessed via the project page: https://keio-csg.github.io/Ghost-FWL