ChatPaper.aiChatPaper

스파스 레인포머

Sparse Laneformer

April 11, 2024
저자: Ji Liu, Zifeng Zhang, Mingjie Lu, Hongyang Wei, Dong Li, Yile Xie, Jinzhang Peng, Lu Tian, Ashish Sirasao, Emad Barsoum
cs.AI

초록

차선 검출은 자율 주행의 핵심 과제 중 하나이며, 딥러닝의 등장으로 큰 발전을 이루어 왔습니다. 기존의 앵커 기반 방법들은 주로 조밀한 앵커를 설계하는데, 이는 학습 데이터셋에 크게 의존하며 추론 과정에서 고정된 상태로 유지됩니다. 본 연구에서는 차선 검출을 위해 조밀한 앵커가 반드시 필요하지 않음을 분석하고, 희소 앵커 메커니즘을 기반으로 한 트랜스포머 기반 차선 검출 프레임워크를 제안합니다. 이를 위해 전통적인 명시적 앵커 대신 위치 인식 차선 쿼리와 각도 쿼리를 사용하여 희소 앵커를 생성합니다. 수평 방향으로 차선 특징을 집계하기 위해 Horizontal Perceptual Attention(HPA)을 도입하고, 차선 쿼리와 각도 쿼리 간의 상호작용을 수행하기 위해 Lane-Angle Cross Attention(LACA)을 적용합니다. 또한, 변형 가능한 교차 주의력 기반의 Lane Perceptual Attention(LPA)을 제안하여 차선 예측을 더욱 정교화합니다. 우리의 방법은 Sparse Laneformer로 명명되었으며, 구현이 간단하고 종단간 학습이 가능합니다. 광범위한 실험을 통해 Sparse Laneformer가 최신 방법들에 비해 우수한 성능을 보임을 입증하였습니다. 예를 들어, 동일한 ResNet-34 백본을 사용한 CULane 데이터셋에서 Laneformer보다 3.0% 높은 F1 점수를, O2SFormer보다 0.7% 높은 F1 점수를 달성하면서 더 적은 MACs를 사용하였습니다.
English
Lane detection is a fundamental task in autonomous driving, and has achieved great progress as deep learning emerges. Previous anchor-based methods often design dense anchors, which highly depend on the training dataset and remain fixed during inference. We analyze that dense anchors are not necessary for lane detection, and propose a transformer-based lane detection framework based on a sparse anchor mechanism. To this end, we generate sparse anchors with position-aware lane queries and angle queries instead of traditional explicit anchors. We adopt Horizontal Perceptual Attention (HPA) to aggregate the lane features along the horizontal direction, and adopt Lane-Angle Cross Attention (LACA) to perform interactions between lane queries and angle queries. We also propose Lane Perceptual Attention (LPA) based on deformable cross attention to further refine the lane predictions. Our method, named Sparse Laneformer, is easy-to-implement and end-to-end trainable. Extensive experiments demonstrate that Sparse Laneformer performs favorably against the state-of-the-art methods, e.g., surpassing Laneformer by 3.0% F1 score and O2SFormer by 0.7% F1 score with fewer MACs on CULane with the same ResNet-34 backbone.

Summary

AI-Generated Summary

PDF121December 15, 2024