ChatPaper.aiChatPaper

LoGoPlanner: Politica di Navigazione Basata sulla Localizzazione con Geometria Visiva Consapevole delle Metriche

LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry

December 22, 2025
Autori: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang
cs.AI

Abstract

La pianificazione di traiettorie in ambienti non strutturati è una capacità fondamentale e impegnativa per i robot mobili. Le tradizionali pipeline modulari soffrono di latenza e errori a cascata tra i moduli di percezione, localizzazione, mappatura e pianificazione. I recenti metodi di apprendimento end-to-end mappano le osservazioni visive grezze direttamente su segnali di controllo o traiettorie, promettendo prestazioni ed efficienza superiori in contesti open-world. Tuttavia, la maggior parte dei precedenti approcci end-to-end dipende ancora da moduli di localizzazione separati che richiedono una calibrazione estrinseca accurata dei sensori per la stima dello stato proprio, limitando così la generalizzazione tra diverse implementazioni e ambienti. Introduciamo LoGoPlanner, un framework di navigazione end-to-end basato sulla localizzazione che affronta queste limitazioni attraverso: (1) il fine-tuning di un backbone visivo-geometrico a lungo orizzonte per ancorare le previsioni a una scala metrica assoluta, fornendo così una stima implicita dello stato per una localizzazione accurata; (2) la ricostruzione della geometria della scena circostante dalle osservazioni storiche per fornire una consapevolezza ambientale densa e granulare necessaria per un'evitamento affidabile degli ostacoli; e (3) il condizionamento della policy su una geometria implicita avviata dai suddetti compiti ausiliari, riducendo così la propagazione degli errori. Valutiamo LoGoPlanner sia in simulazione che in scenari reali, dove il suo design completamente end-to-end riduce l'errore cumulativo, mentre la memoria geometrica metric-aware migliora la coerenza della pianificazione e l'evitamento degli ostacoli, portando a un miglioramento superiore al 27,3% rispetto ai baseline con localizzazione oracle e a una forte generalizzazione tra diverse implementazioni e ambienti. Il codice e i modelli sono stati resi pubblicamente disponibili sulla {pagina del progetto} https://steinate.github.io/logoplanner.github.io/.
English
Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation.We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io/{project page}.
PDF182December 24, 2025