Laneformer Escaso
Sparse Laneformer
April 11, 2024
Autores: Ji Liu, Zifeng Zhang, Mingjie Lu, Hongyang Wei, Dong Li, Yile Xie, Jinzhang Peng, Lu Tian, Ashish Sirasao, Emad Barsoum
cs.AI
Resumen
La detección de carriles es una tarea fundamental en la conducción autónoma y ha logrado grandes avances con el surgimiento del aprendizaje profundo. Los métodos anteriores basados en anclajes suelen diseñar anclajes densos, que dependen en gran medida del conjunto de datos de entrenamiento y permanecen fijos durante la inferencia. Analizamos que los anclajes densos no son necesarios para la detección de carriles y proponemos un marco de detección de carriles basado en transformadores que utiliza un mecanismo de anclajes dispersos. Para ello, generamos anclajes dispersos con consultas de carril conscientes de la posición y consultas de ángulo, en lugar de los anclajes explícitos tradicionales. Adoptamos la Atención Perceptual Horizontal (HPA) para agregar las características del carril a lo largo de la dirección horizontal, y utilizamos la Atención Cruzada Carril-Ángulo (LACA) para realizar interacciones entre las consultas de carril y las consultas de ángulo. También proponemos la Atención Perceptual de Carril (LPA) basada en la atención cruzada deformable para refinar aún más las predicciones de carril. Nuestro método, denominado Sparse Laneformer, es fácil de implementar y entrenable de extremo a extremo. Experimentos exhaustivos demuestran que Sparse Laneformer supera favorablemente a los métodos más avanzados, por ejemplo, superando a Laneformer en un 3.0% en puntuación F1 y a O2SFormer en un 0.7% en puntuación F1, con menos operaciones MAC en CULane utilizando la misma arquitectura ResNet-34.
English
Lane detection is a fundamental task in autonomous driving, and has achieved
great progress as deep learning emerges. Previous anchor-based methods often
design dense anchors, which highly depend on the training dataset and remain
fixed during inference. We analyze that dense anchors are not necessary for
lane detection, and propose a transformer-based lane detection framework based
on a sparse anchor mechanism. To this end, we generate sparse anchors with
position-aware lane queries and angle queries instead of traditional explicit
anchors. We adopt Horizontal Perceptual Attention (HPA) to aggregate the lane
features along the horizontal direction, and adopt Lane-Angle Cross Attention
(LACA) to perform interactions between lane queries and angle queries. We also
propose Lane Perceptual Attention (LPA) based on deformable cross attention to
further refine the lane predictions. Our method, named Sparse Laneformer, is
easy-to-implement and end-to-end trainable. Extensive experiments demonstrate
that Sparse Laneformer performs favorably against the state-of-the-art methods,
e.g., surpassing Laneformer by 3.0% F1 score and O2SFormer by 0.7% F1 score
with fewer MACs on CULane with the same ResNet-34 backbone.Summary
AI-Generated Summary