MapAgent: Um Framework Agêntico de Nível Industrial para Geração de Mapas de Faixa em Escala Urbana
MapAgent: An Industrial-Grade Agentic Framework for City-scale Lane-level Map Generation
June 3, 2026
Autores: Deguo Xia, Zihan Li, Haochen Zhao, Dong Xie, Yuyao Kong, Xiyan Liu, Jizhou Huang, Mengmeng Yang, Diange Yang
cs.AI
Resumo
Mapas de nível de faixa são infraestruturas críticas para direção autônoma e navegação em nível de faixa, mas construir e manter redes de faixas padronizadas para centenas de cidades ainda é altamente intensivo em mão de obra. Métodos recentes de mapeamento vetorizado de ponta a ponta conseguem prever a geometria e a topologia das faixas diretamente a partir de dados de sensores, mas normalmente tratam as especificações de mapeamento e as regulamentações de trânsito como supervisão implícita e dependente do conjunto de dados. Além disso, em cenas complexas (por exemplo, marcações desgastadas ou ausentes e oclusões), as configurações corretas das faixas são frequentemente subdeterminadas apenas pelas evidências visuais, tornando as violações de especificação uma das principais fontes de pós-edição humana. Propomos o MapAgent, uma arquitetura agêntica de nível industrial que amplia uma espinha dorsal de vetorização para a produção de mapas de faixa em conformidade com as especificações. Em vez de apenas adicionar um loop de agente à previsão do mapa, o MapAgent combina a percepção da espinha dorsal com verificação explícita de especificações, raciocínio sensível a restrições e edição determinística de mapas sob um loop delimitado e orientado por verificação, composto por Juiz-Planejador-Trabalhador. Um Juiz de visão-linguagem diagnostica erros inspecionando conjuntamente as evidências visuais e os vetores do rascunho, enquanto um Planejador que invoca ferramentas gera correções mínimas editadas, com revalidação posterior à edição. Para permanecer escalável na produção em escala urbana, o MapAgent é acionado seletivamente apenas em tiles com baixa confiança da espinha dorsal, adicionando uma sobrecarga modesta enquanto mantém a taxa de transferência. Experimentos em conjuntos de dados reais mostram ganhos consistentes em relação a benchmarks de produção robustos, especialmente em cenários complexos e de cauda longa. Além disso, o MapAgent foi integrado ao Baidu Maps, apoiando a geração de mapas de nível de faixa para mais de 360 cidades em todo o país e elevando a automação geral da produção para mais de 95%, demonstrando a praticidade e a eficácia do MapAgent para geração de mapas de nível de faixa em grande escala.
English
Lane-level maps are critical infrastructure for autonomous driving and lane-level navigation, yet constructing and maintaining standardized lane networks for hundreds of cities remains highly labor-intensive. Recent end-to-end vectorized mapping methods can predict lane geometry and topology directly from sensor data, but they typically treat mapping specifications and traffic regulations as implicit, dataset-dependent supervision. Moreover, in complex scenes (e.g., worn or missing markings and occlusions), correct lane configurations are often under-determined by visual evidence alone, making specification violations a major source of human post-editing. We propose MapAgent, an industrial-grade agentic architecture that augments a vectorization backbone for specification-compliant lane-map production. Rather than merely adding an agent loop to map prediction, MapAgent couples backbone perception with explicit specification verification, constraint-aware reasoning, and deterministic map editing under a bounded, verification-driven Judge-Planner-Worker loop. A vision-language Judge diagnoses errors by jointly inspecting visual evidence and draft vectors, while a tool-calling Planner generates minimal corrective edits with post-edit re-validation. To remain scalable for city-scale production, MapAgent is selectively triggered only on tiles with low backbone confidence, adding modest overhead while preserving throughput. Experiments on real-world datasets show consistent gains over strong production baselines, especially in complex and long-tail scenarios. Additionally, MapAgent has been integrated into Baidu Maps, supporting lane-level map generation for over 360 cities nationwide and elevating the overall production automation to over 95%, demonstrating MapAgent's practicality and effectiveness for large-scale lane-level map generation.