ChatPaper.aiChatPaper

Sparse Laneformer

Sparse Laneformer

April 11, 2024
Auteurs: Ji Liu, Zifeng Zhang, Mingjie Lu, Hongyang Wei, Dong Li, Yile Xie, Jinzhang Peng, Lu Tian, Ashish Sirasao, Emad Barsoum
cs.AI

Résumé

La détection de voies est une tâche fondamentale dans la conduite autonome et a réalisé des progrès significatifs avec l'émergence de l'apprentissage profond. Les méthodes précédentes basées sur des ancres conçoivent souvent des ancres denses, qui dépendent fortement du jeu de données d'entraînement et restent fixes pendant l'inférence. Nous analysons que les ancres denses ne sont pas nécessaires pour la détection de voies et proposons un cadre de détection de voies basé sur un transformateur utilisant un mécanisme d'ancres éparses. À cette fin, nous générons des ancres éparses avec des requêtes de voies sensibles à la position et des requêtes d'angle, plutôt que des ancres explicites traditionnelles. Nous adoptons l'Attention Perceptive Horizontale (HPA) pour agréger les caractéristiques des voies le long de la direction horizontale, et utilisons l'Attention Croisée Voie-Angle (LACA) pour effectuer des interactions entre les requêtes de voies et les requêtes d'angle. Nous proposons également l'Attention Perceptive de Voie (LPA) basée sur l'attention croisée déformable pour affiner davantage les prédictions de voies. Notre méthode, nommée Sparse Laneformer, est facile à implémenter et entraînable de bout en bout. Des expériences approfondies démontrent que Sparse Laneformer surpasse les méthodes de pointe, par exemple en dépassant Laneformer de 3,0 % en score F1 et O2SFormer de 0,7 % en score F1 avec moins d'opérations MAC sur CULane avec le même réseau de base ResNet-34.
English
Lane detection is a fundamental task in autonomous driving, and has achieved great progress as deep learning emerges. Previous anchor-based methods often design dense anchors, which highly depend on the training dataset and remain fixed during inference. We analyze that dense anchors are not necessary for lane detection, and propose a transformer-based lane detection framework based on a sparse anchor mechanism. To this end, we generate sparse anchors with position-aware lane queries and angle queries instead of traditional explicit anchors. We adopt Horizontal Perceptual Attention (HPA) to aggregate the lane features along the horizontal direction, and adopt Lane-Angle Cross Attention (LACA) to perform interactions between lane queries and angle queries. We also propose Lane Perceptual Attention (LPA) based on deformable cross attention to further refine the lane predictions. Our method, named Sparse Laneformer, is easy-to-implement and end-to-end trainable. Extensive experiments demonstrate that Sparse Laneformer performs favorably against the state-of-the-art methods, e.g., surpassing Laneformer by 3.0% F1 score and O2SFormer by 0.7% F1 score with fewer MACs on CULane with the same ResNet-34 backbone.

Summary

AI-Generated Summary

PDF121December 15, 2024