DiffusionLane: Diffusiemodel voor rijstrookdetectie
DiffusionLane: Diffusion Model for Lane Detection
October 25, 2025
Auteurs: Kunyang Zhou, Yeqin Shao
cs.AI
Samenvatting
In dit artikel presenteren wij een nieuw op diffusie gebaseerd model voor rijstrookdetectie, genaamd DiffusionLane, dat de taak van rijstrookdetectie behandelt als een denoisering-diffusieproces in de parameterruimte van de rijstrook. Ten eerste voegen we Gaussische ruis toe aan de parameters (het startpunt en de hoek) van grondwaarheid-rijstroken om verstoorde rijstrookankers te verkrijgen, waarbij het model leert om deze verstoorde ankers op een progressieve manier te verfijnen om de doelrijstroken te verkrijgen. Ten tweede stellen we een hybride decodeerstrategie voor om de zwakke kenmerkrepresentatie van de encoder aan te pakken, die voortkomt uit de verstoorde rijstrookankers. Concreet ontwerpen we een hybride diffusiedecoder die globale en lokale decoders combineert voor hoogwaardige rijstrookankers. Vervolgens gebruiken we, om de kenmerkrepresentatie van de encoder te verbeteren, een hulpkop (auxiliary head) tijdens de trainingsfase om leerbare rijstrookankers toe te passen voor een verrijkte supervisie op de encoder. Experimentele resultaten op vier benchmarks, Carlane, Tusimple, CULane en LLAMAS, tonen aan dat DiffusionLane een sterke generalisatiecapaciteit en veelbelovende detectieprestaties bezit in vergelijking met eerdere state-of-the-art methoden. Zo overtreft DiffusionLane met ResNet18 de bestaande methoden met ten minste 1% nauwkeurigheid op de domeinadaptatiedataset Carlane. Daarnaast behaalt DiffusionLane met MobileNetV4 een F1-score van 81,32% op CULane, 96,89% nauwkeurigheid op Tusimple met ResNet34, en een F1-score van 97,59% op LLAMAS met ResNet101. De code zal beschikbaar zijn op https://github.com/zkyntu/UnLanedet.
English
In this paper, we present a novel diffusion-based model for lane detection,
called DiffusionLane, which treats the lane detection task as a denoising
diffusion process in the parameter space of the lane. Firstly, we add the
Gaussian noise to the parameters (the starting point and the angle) of ground
truth lanes to obtain noisy lane anchors, and the model learns to refine the
noisy lane anchors in a progressive way to obtain the target lanes. Secondly,
we propose a hybrid decoding strategy to address the poor feature
representation of the encoder, resulting from the noisy lane anchors.
Specifically, we design a hybrid diffusion decoder to combine global-level and
local-level decoders for high-quality lane anchors. Then, to improve the
feature representation of the encoder, we employ an auxiliary head in the
training stage to adopt the learnable lane anchors for enriching the
supervision on the encoder. Experimental results on four benchmarks, Carlane,
Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong
generalization ability and promising detection performance compared to the
previous state-of-the-art methods. For example, DiffusionLane with ResNet18
surpasses the existing methods by at least 1\% accuracy on the domain
adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets
81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and
97.59\% F1 score on LLAMAS with ResNet101. Code will be available at
https://github.com/zkyntu/UnLanedet.