ChatPaper.aiChatPaper

DiffusionLane: Diffusionsmodell für Fahrspurerkennung

DiffusionLane: Diffusion Model for Lane Detection

October 25, 2025
papers.authors: Kunyang Zhou, Yeqin Shao
cs.AI

papers.abstract

In diesem Beitrag stellen wir ein neuartiges, diffusionsbasiertes Modell für die Fahrspurerkennung vor, genannt DiffusionLane, das die Aufgabe der Fahrspurerkennung als einen Denoising-Diffusionsprozess im Parameterraum der Fahrspur behandelt. Zunächst fügen wir den Parametern (Startpunkt und Winkel) der Ground-Truth-Fahrspuren Gaußsches Rauschen hinzu, um verrauschte Fahrspur-Anker zu erhalten, und das Modell lernt, diese verrauschten Anker schrittweise zu verfeinern, um die Ziel-Fahrspuren zu erhalten. Zweitens schlagen wir eine hybride Decodierstrategie vor, um die schwache Merkmalsrepräsentation des Encoders, die durch die verrauschten Fahrspur-Anker verursacht wird, zu adressieren. Konkret entwerfen wir einen hybriden Diffusions-Decoder, der globale und lokale Decoder für hochwertige Fahrspur-Anker kombiniert. Um dann die Merkmalsrepräsentation des Encoders zu verbessern, setzen wir während des Trainings einen zusätzlichen Head ein, der lernbare Fahrspur-Anker verwendet, um die Überwachung des Encoders zu verstärken. Experimentelle Ergebnisse auf vier Benchmarks – Carlane, Tusimple, CULane und LLAMAS – zeigen, dass DiffusionLane im Vergleich zu früheren State-of-the-Art-Methoden eine starke Generalisierungsfähigkeit und vielversprechende Detektionsleistung aufweist. Beispielsweise übertrifft DiffusionLane mit ResNet18 die vorhandenen Methoden um mindestens 1 % Genauigkeit auf dem Domain-Adaptation-Datensatz Carlane. Zudem erzielt DiffusionLane mit MobileNetV4 einen F1-Score von 81,32 % auf CULane, 96,89 % Genauigkeit auf Tusimple mit ResNet34 und 97,59 % F1-Score auf LLAMAS mit ResNet101. Der Code wird unter https://github.com/zkyntu/UnLanedet verfügbar sein.
English
In this paper, we present a novel diffusion-based model for lane detection, called DiffusionLane, which treats the lane detection task as a denoising diffusion process in the parameter space of the lane. Firstly, we add the Gaussian noise to the parameters (the starting point and the angle) of ground truth lanes to obtain noisy lane anchors, and the model learns to refine the noisy lane anchors in a progressive way to obtain the target lanes. Secondly, we propose a hybrid decoding strategy to address the poor feature representation of the encoder, resulting from the noisy lane anchors. Specifically, we design a hybrid diffusion decoder to combine global-level and local-level decoders for high-quality lane anchors. Then, to improve the feature representation of the encoder, we employ an auxiliary head in the training stage to adopt the learnable lane anchors for enriching the supervision on the encoder. Experimental results on four benchmarks, Carlane, Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong generalization ability and promising detection performance compared to the previous state-of-the-art methods. For example, DiffusionLane with ResNet18 surpasses the existing methods by at least 1\% accuracy on the domain adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets 81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and 97.59\% F1 score on LLAMAS with ResNet101. Code will be available at https://github.com/zkyntu/UnLanedet.
PDF31December 31, 2025