ChatPaper.aiChatPaper

DiffusionLane: 車線検出のための拡散モデル

DiffusionLane: Diffusion Model for Lane Detection

October 25, 2025
著者: Kunyang Zhou, Yeqin Shao
cs.AI

要旨

本論文では、車線検出タスクを車線パラメータ空間におけるノイズ除去拡散過程として扱う、DiffusionLaneと名付けた新しい拡散ベースの車線検出モデルを提案する。まず、教師データの車線パラメータ(始点と角度)にガウシアンノイズを付加してノイズ付き車線アンカーを取得し、モデルはノイジーな車線アンカーを段階的に精緻化して対象車線を得るように学習する。次に、ノイズ付き車線アンカーに起因するエンコーダの特徴表現の弱さに対処するため、ハイブリッド復号化戦略を提案する。具体的には、高品質な車線アンカー生成のために、グローバルレベルとローカルレベルのデコーダを組み合わせたハイブリッド拡散デコーダを設計する。さらに、エンコーダの特徴表現を改善するため、学習段階において補助ヘッドを用いて学習可能な車線アンカーを採用し、エンコーダに対する監督信号を強化する。4つのベンチマーク(Carlane、Tusimple、CULane、LLAMAS)での実験結果から、DiffusionLaneは従来の最先端手法と比較して強力な一般化能力と有望な検出性能を有することが示された。例えば、ResNet18をバックボーンとするDiffusionLaneは、ドメイン適応データセットであるCarlaneにおいて、既存手法を精度で少なくとも1%上回った。さらに、MobileNetV4をバックボーンとするDiffusionLaneはCULaneで81.32%のF1スコアを、ResNet34をバックボーンとする場合はTusimpleで96.89%の精度を、ResNet101をバックボーンとする場合はLLAMASで97.59%のF1スコアを達成した。コードはhttps://github.com/zkyntu/UnLanedet で公開予定である。
English
In this paper, we present a novel diffusion-based model for lane detection, called DiffusionLane, which treats the lane detection task as a denoising diffusion process in the parameter space of the lane. Firstly, we add the Gaussian noise to the parameters (the starting point and the angle) of ground truth lanes to obtain noisy lane anchors, and the model learns to refine the noisy lane anchors in a progressive way to obtain the target lanes. Secondly, we propose a hybrid decoding strategy to address the poor feature representation of the encoder, resulting from the noisy lane anchors. Specifically, we design a hybrid diffusion decoder to combine global-level and local-level decoders for high-quality lane anchors. Then, to improve the feature representation of the encoder, we employ an auxiliary head in the training stage to adopt the learnable lane anchors for enriching the supervision on the encoder. Experimental results on four benchmarks, Carlane, Tusimple, CULane, and LLAMAS, show that DiffusionLane possesses a strong generalization ability and promising detection performance compared to the previous state-of-the-art methods. For example, DiffusionLane with ResNet18 surpasses the existing methods by at least 1\% accuracy on the domain adaptation dataset Carlane. Besides, DiffusionLane with MobileNetV4 gets 81.32\% F1 score on CULane, 96.89\% accuracy on Tusimple with ResNet34, and 97.59\% F1 score on LLAMAS with ResNet101. Code will be available at https://github.com/zkyntu/UnLanedet.
PDF31December 31, 2025