DiffusionLane: Modelo de Difusión para la Detección de Carriles
DiffusionLane: Diffusion Model for Lane Detection
October 25, 2025
Autores: Kunyang Zhou, Yeqin Shao
cs.AI
Resumen
En este artículo, presentamos un modelo novedoso basado en difusión para la detección de carriles, denominado DiffusionLane, que aborda la tarea de detección de carriles como un proceso de difusión por eliminación de ruido en el espacio de parámetros del carril. En primer lugar, añadimos ruido gaussiano a los parámetros (el punto de inicio y el ángulo) de los carriles de referencia para obtener anclajes de carril ruidosos, y el modelo aprende a refinar estos anclajes de manera progresiva para obtener los carriles objetivo. En segundo lugar, proponemos una estrategia de decodificación híbrida para abordar la pobre representación de características del codificador, resultante de los anclajes de carril ruidosos. Específicamente, diseñamos un decodificador de difusión híbrido que combina decodificadores a nivel global y local para generar anclajes de carril de alta calidad. Luego, para mejorar la representación de características del codificador, empleamos una cabeza auxiliar en la etapa de entrenamiento para adoptar anclajes de carril aprendibles que enriquezcan la supervisión del codificador. Los resultados experimentales en cuatro benchmarks, Carlane, Tusimple, CULane y LLAMAS, muestran que DiffusionLane posee una fuerte capacidad de generalización y un rendimiento de detección prometedor en comparación con los métodos anteriores más avanzados. Por ejemplo, DiffusionLane con ResNet18 supera a los métodos existentes por al menos un 1% de precisión en el conjunto de datos de adaptación de dominio Carlane. Además, DiffusionLane con MobileNetV4 obtiene un 81,32% de puntuación F1 en CULane, un 96,89% de precisión en Tusimple con ResNet34, y un 97,59% de puntuación F1 en LLAMAS con ResNet101. El código estará disponible en https://github.com/zkyntu/UnLanedet.
English
In this paper, we present a novel diffusion-based model for lane detection,
called DiffusionLane, which treats the lane detection task as a denoising
diffusion process in the parameter space of the lane. Firstly, we add the
Gaussian noise to the parameters (the starting point and the angle) of ground
truth lanes to obtain noisy lane anchors, and the model learns to refine the
noisy lane anchors in a progressive way to obtain the target lanes. Secondly,
we propose a hybrid decoding strategy to address the poor feature
representation of the encoder, resulting from the noisy lane anchors.
Specifically, we design a hybrid diffusion decoder to combine global-level and
local-level decoders for high-quality lane anchors. Then, to improve the
feature representation of the encoder, we employ an auxiliary head in the
training stage to adopt the learnable lane anchors for enriching the
supervision on the encoder. Experimental results on four benchmarks, Carlane,
Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong
generalization ability and promising detection performance compared to the
previous state-of-the-art methods. For example, DiffusionLane with ResNet18
surpasses the existing methods by at least 1\% accuracy on the domain
adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets
81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and
97.59\% F1 score on LLAMAS with ResNet101. Code will be available at
https://github.com/zkyntu/UnLanedet.