ChatPaper.aiChatPaper

DiffusionLane: 차선 감지를 위한 확산 모델

DiffusionLane: Diffusion Model for Lane Detection

October 25, 2025
저자: Kunyang Zhou, Yeqin Shao
cs.AI

초록

본 논문에서는 차선 검출 작업을 차선 매개변수 공간에서의 노이즈 제거 확산 과정으로 처리하는 DiffusionLane이라는 새로운 확산 기반 차선 검출 모델을 제안한다. 첫째, 실제 차선의 매개변수(시작점과 각도)에 가우시안 노이즈를 추가하여 노이즈가 포함된 차선 앵커를 얻고, 모델은 이 노이즈가 포함된 차선 앵커를 점진적으로 정제하여 목표 차선을 얻는 방법을 학습한다. 둘째, 노이즈가 포함된 차선 앵커로 인한 인코더의 취약한 특징 표현 문제를 해결하기 위해 하이브리드 디코딩 전략을 제안한다. 구체적으로, 고품질 차선 앵커 생성을 위해 전역 수준 디코더와 지역 수준 디코더를 결합한 하이브리드 확산 디코더를 설계한다. 또한 인코더의 특징 표현을 개선하기 위해 학습 단계에 보조 헤드를 도입하여 학습 가능한 차선 앵커를 활용함으로써 인코더에 대한 감독 학습을 강화한다. Carlane, Tusimple, CULane, LLAMAS 네 가지 벤치마크에서의 실험 결과는 DiffusionLane이 기존 최신 방법 대비 강력한 일반화 능력과 우수한 검출 성능을 보여준다. 예를 들어, ResNet18 기반 DiffusionLane은 도메인 적응 데이터셋인 Carlane에서 기존 방법들을 최소 1% 정확도로 앞섰다. 또한 MobileNetV4 기반 DiffusionLane은 CULane에서 81.32% F1 점수를, ResNet34 기반은 Tusimple에서 96.89% 정확도를, ResNet101 기반은 LLAMAS에서 97.59% F1 점수를 각각 기록했다. 코드는 https://github.com/zkyntu/UnLanedet에서 공개될 예정이다.
English
In this paper, we present a novel diffusion-based model for lane detection, called DiffusionLane, which treats the lane detection task as a denoising diffusion process in the parameter space of the lane. Firstly, we add the Gaussian noise to the parameters (the starting point and the angle) of ground truth lanes to obtain noisy lane anchors, and the model learns to refine the noisy lane anchors in a progressive way to obtain the target lanes. Secondly, we propose a hybrid decoding strategy to address the poor feature representation of the encoder, resulting from the noisy lane anchors. Specifically, we design a hybrid diffusion decoder to combine global-level and local-level decoders for high-quality lane anchors. Then, to improve the feature representation of the encoder, we employ an auxiliary head in the training stage to adopt the learnable lane anchors for enriching the supervision on the encoder. Experimental results on four benchmarks, Carlane, Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong generalization ability and promising detection performance compared to the previous state-of-the-art methods. For example, DiffusionLane with ResNet18 surpasses the existing methods by at least 1\% accuracy on the domain adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets 81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and 97.59\% F1 score on LLAMAS with ResNet101. Code will be available at https://github.com/zkyntu/UnLanedet.
PDF31December 31, 2025