ChatPaper.aiChatPaper

LoGoPlanner: Стратегия навигации на основе локализации с метрически-осознанной визуальной геометрией

LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry

December 22, 2025
Авторы: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang
cs.AI

Аннотация

Планирование траектории в неструктурированных средах является фундаментальной и сложной задачей для мобильных роботов. Традиционные модульные конвейеры страдают от задержек и каскадных ошибок между модулями восприятия, локализации, картографирования и планирования. Новые сквозные методы обучения напрямую отображают необработанные визуальные наблюдения в управляющие сигналы или траектории, обещая более высокую производительность и эффективность в условиях реального мира. Однако большинство существующих сквозных подходов по-прежнему зависят от отдельных модулей локализации, которые требуют точной внешней калибровки сенсоров для оценки собственного состояния, что ограничивает обобщение между различными платформами и средами. Мы представляем LoGoPlanner — сквозную навигационную систему, основанную на локализации, которая решает эти ограничения за счет: (1) дообучения бэкбона визуальной геометрии для прогнозирования с абсолютным метрическим масштабом, обеспечивая неявную оценку состояния для точной локализации; (2) реконструкции геометрии окружающей сцены из исторических наблюдений для обеспечения плотного, детального восприятия среды для надежного избегания препятствий; и (3) обусловливания политики неявной геометрией, инициализированной вышеупомянутыми вспомогательными задачами, тем самым снижая распространение ошибок. Мы оцениваем LoGoPlanner в симуляции и реальных условиях, где его полностью сквозная архитектура снижает кумулятивную ошибку, а метрически осведомленная геометрическая память улучшает согласованность планирования и избегание препятствий, что приводит к улучшению более чем на 27,3% по сравнению с базовыми методами, использующими точную локализацию, и демонстрирует сильное обобщение между платформами и средами. Код и модели общедоступны на https://steinate.github.io/logoplanner.github.io/{странице проекта}.
English
Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation.We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io/{project page}.
PDF182December 24, 2025