MapAgent: 都市規模の車線レベル地図生成のための産業グレードエージェントフレームワーク
MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation
June 3, 2026
著者: Deguo Xia, Zihan Li, Haochen Zhao, Dong Xie, Yuyao Kong, Xiyan Liu, Jizhou Huang, Mengmeng Yang, Diange Yang
cs.AI
要旨
レーンレベルの地図は自動運転およびレーンレベルのナビゲーションにとって重要な基盤であるが、数百もの都市に対して標準化されたレーンネットワークを構築・維持することは依然として極めて労働集約的である。近年のエンドツーエンドのベクトル化マッピング手法は、センサーデータから直接レーンの形状やトポロジーを予測できるが、通常、マッピング仕様や交通規制を暗黙的かつデータセット依存の教師信号として扱う。さらに、複雑なシーン(例えば、摩耗や欠落した標示、遮蔽など)では、視覚的証拠のみでは正しいレーン構成が決定不能となる場合が多く、仕様違反が人間による後処理の主な原因となっている。我々は、仕様に準拠したレーンマップ生成のためのベクトル化バックボーンを強化する、産業グレードのエージェント的アーキテクチャであるMapAgentを提案する。MapAgentは、単にエージェントループをマップ予測に追加するのではなく、バックボーンの知覚と明示的な仕様検証、制約認識推論、および決定論的なマップ編集を、限定された検証駆動型のJudge-Planner-Workerループの下で結合する。視覚言語モデルであるJudgeは、視覚的証拠とドラフトベクトルを共同で検査することでエラーを診断し、ツール呼び出しを行うPlannerは、最小限の修正編集を生成し、編集後の再検証を行う。都市規模の生成に対応可能にするため、MapAgentはバックボーンの信頼度が低いタイルにのみ選択的にトリガーされ、スループットを維持しつつ追加のオーバーヘッドを抑える。実世界のデータセットを用いた実験では、特に複雑でロングテールなシナリオにおいて、強力なプロダクションベースラインを一貫して上回る改善を示した。さらに、MapAgentはBaidu Mapsに統合され、全国360以上の都市におけるレーンレベルの地図生成をサポートし、全体的な生成自動化率を95%以上に引き上げており、大規模なレーンレベル地図生成におけるMapAgentの実用性と有効性を示している。
English
Lane-level maps are critical infrastructure for autonomous driving and lane-level navigation, yet constructing and maintaining standardized lane networks for hundreds of cities remains highly labor-intensive. Recent end-to-end vectorized mapping methods can predict lane geometry and topology directly from sensor data, but they typically treat mapping specifications and traffic regulations as implicit, dataset-dependent supervision. Moreover, in complex scenes (e.g., worn or missing markings and occlusions), correct lane configurations are often under-determined by visual evidence alone, making specification violations a major source of human post-editing. We propose MapAgent, an industrial-grade agentic architecture that augments a vectorization backbone for specification-compliant lane-map production. Rather than merely adding an agent loop to map prediction, MapAgent couples backbone perception with explicit specification verification, constraint-aware reasoning, and deterministic map editing under a bounded, verification-driven Judge-Planner-Worker loop. A vision-language Judge diagnoses errors by jointly inspecting visual evidence and draft vectors, while a tool-calling Planner generates minimal corrective edits with post-edit re-validation. To remain scalable for city-scale production, MapAgent is selectively triggered only on tiles with low backbone confidence, adding modest overhead while preserving throughput. Experiments on real-world datasets show consistent gains over strong production baselines, especially in complex and long-tail scenarios. Additionally, MapAgent has been integrated into Baidu Maps, supporting lane-level map generation for over 360 cities nationwide and elevating the overall production automation to over 95%, demonstrating MapAgent's practicality and effectiveness for large-scale lane-level map generation.