Sparse Laneformer
Sparse Laneformer
April 11, 2024
Auteurs: Ji Liu, Zifeng Zhang, Mingjie Lu, Hongyang Wei, Dong Li, Yile Xie, Jinzhang Peng, Lu Tian, Ashish Sirasao, Emad Barsoum
cs.AI
Samenvatting
Lanedetectie is een fundamentele taak in autonoom rijden en heeft grote vooruitgang geboekt sinds de opkomst van deep learning. Eerdere ankergebaseerde methoden ontwerpen vaak dichte ankers, die sterk afhankelijk zijn van de trainingsdataset en tijdens de inferentie vast blijven. Wij analyseren dat dichte ankers niet noodzakelijk zijn voor lanedetectie en stellen een transformer-gebaseerd lanedetectiekader voor op basis van een spaarzaam ankermechanisme. Hiertoe genereren we spaarzame ankers met positiebewuste lane queries en hoekqueries in plaats van traditionele expliciete ankers. We gebruiken Horizontale Perceptuele Aandacht (HPA) om de lanekenmerken langs de horizontale richting te aggregeren en Lane-Hoek Kruis Aandacht (LACA) om interacties tussen lane queries en hoekqueries uit te voeren. We stellen ook Lane Perceptuele Aandacht (LPA) voor, gebaseerd op vervormbare kruisaandacht, om de lanevoorspellingen verder te verfijnen. Onze methode, genaamd Sparse Laneformer, is eenvoudig te implementeren en end-to-end trainbaar. Uitgebreide experimenten tonen aan dat Sparse Laneformer gunstig presteert in vergelijking met state-of-the-art methoden, bijvoorbeeld door Laneformer met 3,0% F1-score en O2SFormer met 0,7% F1-score te overtreffen met minder MACs op CULane met dezelfde ResNet-34 backbone.
English
Lane detection is a fundamental task in autonomous driving, and has achieved
great progress as deep learning emerges. Previous anchor-based methods often
design dense anchors, which highly depend on the training dataset and remain
fixed during inference. We analyze that dense anchors are not necessary for
lane detection, and propose a transformer-based lane detection framework based
on a sparse anchor mechanism. To this end, we generate sparse anchors with
position-aware lane queries and angle queries instead of traditional explicit
anchors. We adopt Horizontal Perceptual Attention (HPA) to aggregate the lane
features along the horizontal direction, and adopt Lane-Angle Cross Attention
(LACA) to perform interactions between lane queries and angle queries. We also
propose Lane Perceptual Attention (LPA) based on deformable cross attention to
further refine the lane predictions. Our method, named Sparse Laneformer, is
easy-to-implement and end-to-end trainable. Extensive experiments demonstrate
that Sparse Laneformer performs favorably against the state-of-the-art methods,
e.g., surpassing Laneformer by 3.0% F1 score and O2SFormer by 0.7% F1 score
with fewer MACs on CULane with the same ResNet-34 backbone.