ChatPaper.aiChatPaper

拡散モデルを精練化して効率的な3D LiDARシーン補完を実現する

Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion

December 4, 2024
著者: Shengyuan Zhang, An Zhao, Ling Yang, Zejian Li, Chenye Meng, Haoran Xu, Tianrun Chen, AnYang Wei, Perry Pengyun GU, Lingyun Sun
cs.AI

要旨

拡散モデルは、強力なトレーニングの安定性と高い完了品質から、3D LiDARシーン補完に適用されてきました。ただし、自律車両が周囲環境を効率的に認識する必要があるため、拡散ベースのシーン補完モデルの実用化が遅いサンプリング速度によって制限されています。本論文では、3D LiDARシーン補完モデル向けに特別に設計された新しい蒸留手法であるScoreLiDARを提案し、効率的でありながら高品質なシーン補完を実現します。ScoreLiDARは、蒸留後に著しく少ないステップでサンプリングするように蒸留モデルを可能にします。完了品質を向上させるために、3D LiDARシーンの幾何学的構造を捉えるように蒸留モデルを促す新しい構造損失も導入します。この損失には、全体的な構造を制約するシーン単位の項と、主要なランドマークポイントとそれらの相対配置を制約する点単位の項が含まれています。幅広い実験により、ScoreLiDARは、SemanticKITTIにおいて1フレームあたりの完了時間を30.55秒から5.37秒に大幅に短縮し(5倍以上)、最先端の3D LiDARシーン補完モデルと比較して優れた性能を達成することが示されています。当社のコードは、https://github.com/happyw1nd/ScoreLiDAR で公開されています。
English
Diffusion models have been applied to 3D LiDAR scene completion due to their strong training stability and high completion quality. However, the slow sampling speed limits the practical application of diffusion-based scene completion models since autonomous vehicles require an efficient perception of surrounding environments. This paper proposes a novel distillation method tailored for 3D LiDAR scene completion models, dubbed ScoreLiDAR, which achieves efficient yet high-quality scene completion. ScoreLiDAR enables the distilled model to sample in significantly fewer steps after distillation. To improve completion quality, we also introduce a novel Structural Loss, which encourages the distilled model to capture the geometric structure of the 3D LiDAR scene. The loss contains a scene-wise term constraining the holistic structure and a point-wise term constraining the key landmark points and their relative configuration. Extensive experiments demonstrate that ScoreLiDAR significantly accelerates the completion time from 30.55 to 5.37 seconds per frame (>5times) on SemanticKITTI and achieves superior performance compared to state-of-the-art 3D LiDAR scene completion models. Our code is publicly available at https://github.com/happyw1nd/ScoreLiDAR.

Summary

AI-Generated Summary

PDF282December 5, 2024