Ghost-FWL: Um Conjunto de Dados LiDAR de Onda Completa em Larga Escala para Detecção e Remoção de Fantasmas
Ghost-FWL: A Large-Scale Full-Waveform LiDAR Dataset for Ghost Detection and Removal
March 30, 2026
Autores: Kazuma Ikeda, Ryosei Hara, Rokuto Nagata, Ozora Sako. Zihao Ding, Takahiro Kado, Ibuki Fujioka, Taro Beppu, Mariko Isogawa, Kentaro Yoshioka
cs.AI
Resumo
O LiDAR tornou-se uma modalidade de sensoriamento essencial em aplicações de condução autónoma, robótica e cidades inteligentes. No entanto, os pontos fantasmas (ou fantasmas), que são reflexos falsos causados por retornos de laser de múltiplos percursos a partir de superfícies de vidro e refletores, degradam severamente a precisão do mapeamento e da localização 3D. A remoção anterior de fantasmas baseava-se na consistência geométrica em nuvens de pontos densas, falhando nos dados esparsos e dinâmicos do LiDAR móvel. Abordamos esta limitação explorando o LiDAR de forma de onda completa (FWL), que captura perfis temporais completos de intensidade, e não apenas distâncias de pico, fornecendo pistas cruciais para distinguir fantasmas de reflexões genuínas em cenários móveis. Como esta é uma nova tarefa, apresentamos o Ghost-FWL, o primeiro e maior conjunto de dados FWL móvel anotado para deteção e remoção de fantasmas. O Ghost-FWL compreende 24 mil quadros em 10 cenários diversos, com 7,5 mil milhões de anotações a nível de pico, sendo 100 vezes maior do que os conjuntos de dados FWL anotados existentes. Beneficiando deste conjunto de dados de grande escala, estabelecemos um modelo de base baseado em FWL para deteção de fantasmas e propomos o FWL-MAE, um autoencoder mascarado para aprendizagem de representação auto-supervisionada eficiente em dados FWL. Os experimentos mostram que o nosso modelo de base supera os métodos existentes em precisão de remoção de fantasmas, e a nossa remoção de fantasmas melhora ainda mais tarefas subsequentes, como o SLAM baseado em LiDAR (redução de 66% no erro de trajetória) e a deteção de objetos 3D (redução de 50 vezes nos falsos positivos). O conjunto de dados e o código estão publicamente disponíveis e podem ser acedidos através da página do projeto: https://keio-csg.github.io/Ghost-FWL.
English
LiDAR has become an essential sensing modality in autonomous driving, robotics, and smart-city applications. However, ghost points (or ghosts), which are false reflections caused by multi-path laser returns from glass and reflective surfaces, severely degrade 3D mapping and localization accuracy. Prior ghost removal relies on geometric consistency in dense point clouds, failing on mobile LiDAR's sparse, dynamic data. We address this by exploiting full-waveform LiDAR (FWL), which captures complete temporal intensity profiles rather than just peak distances, providing crucial cues for distinguishing ghosts from genuine reflections in mobile scenarios. As this is a new task, we present Ghost-FWL, the first and largest annotated mobile FWL dataset for ghost detection and removal. Ghost-FWL comprises 24K frames across 10 diverse scenes with 7.5 billion peak-level annotations, which is 100x larger than existing annotated FWL datasets. Benefiting from this large-scale dataset, we establish a FWL-based baseline model for ghost detection and propose FWL-MAE, a masked autoencoder for efficient self-supervised representation learning on FWL data. Experiments show that our baseline outperforms existing methods in ghost removal accuracy, and our ghost removal further enhances downstream tasks such as LiDAR-based SLAM (66% trajectory error reduction) and 3D object detection (50x false positive reduction). The dataset and code is publicly available and can be accessed via the project page: https://keio-csg.github.io/Ghost-FWL