スパース・レーンフォーマー
Sparse Laneformer
April 11, 2024
著者: Ji Liu, Zifeng Zhang, Mingjie Lu, Hongyang Wei, Dong Li, Yile Xie, Jinzhang Peng, Lu Tian, Ashish Sirasao, Emad Barsoum
cs.AI
要旨
車線検出は自動運転における基本的なタスクであり、深層学習の登場により大きな進展を遂げてきた。従来のアンカーベースの手法では、多くの場合密なアンカーを設計しており、これらは学習データセットに強く依存し、推論時には固定されたままとなる。本研究では、車線検出において密なアンカーは必要ないことを分析し、スパースなアンカーメカニズムに基づいたトランスフォーマーベースの車線検出フレームワークを提案する。具体的には、従来の明示的なアンカーの代わりに、位置情報を考慮した車線クエリと角度クエリを用いてスパースなアンカーを生成する。水平方向の特徴を集約するためにHorizontal Perceptual Attention (HPA)を採用し、車線クエリと角度クエリ間の相互作用を行うためにLane-Angle Cross Attention (LACA)を採用する。さらに、変形可能なクロスアテンションに基づくLane Perceptual Attention (LPA)を提案し、車線予測をさらに洗練させる。我々の手法はSparse Laneformerと名付けられ、実装が容易でエンドツーエンドで学習可能である。大規模な実験により、Sparse Laneformerが最先端の手法に対して優れた性能を発揮することが示されており、例えば、同じResNet-34バックボーンを使用したCULaneデータセットにおいて、Laneformerを3.0%のF1スコアで、O2SFormerを0.7%のF1スコアで上回り、かつ少ないMACsで達成している。
English
Lane detection is a fundamental task in autonomous driving, and has achieved
great progress as deep learning emerges. Previous anchor-based methods often
design dense anchors, which highly depend on the training dataset and remain
fixed during inference. We analyze that dense anchors are not necessary for
lane detection, and propose a transformer-based lane detection framework based
on a sparse anchor mechanism. To this end, we generate sparse anchors with
position-aware lane queries and angle queries instead of traditional explicit
anchors. We adopt Horizontal Perceptual Attention (HPA) to aggregate the lane
features along the horizontal direction, and adopt Lane-Angle Cross Attention
(LACA) to perform interactions between lane queries and angle queries. We also
propose Lane Perceptual Attention (LPA) based on deformable cross attention to
further refine the lane predictions. Our method, named Sparse Laneformer, is
easy-to-implement and end-to-end trainable. Extensive experiments demonstrate
that Sparse Laneformer performs favorably against the state-of-the-art methods,
e.g., surpassing Laneformer by 3.0% F1 score and O2SFormer by 0.7% F1 score
with fewer MACs on CULane with the same ResNet-34 backbone.Summary
AI-Generated Summary