LoGoPlanner: Navigatiebeleid Gegrond in Lokalisatie met Metrisch-bewuste Visuele Geometrie
LoGoPlanner: Localization Grounded Navigation Policy with Metric-aware Visual Geometry
December 22, 2025
Auteurs: Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, Tai Wang, Yuan Shen, Jiangmiao Pang
cs.AI
Samenvatting
Trajectorieplanning in ongestructureerde omgevingen is een fundamentele en uitdagende capaciteit voor mobierobots. Traditionele modulaire pijplijnen kampen met latentie en cascade-fouten tussen perceptie-, lokalisatie-, mapping- en planningsmodules. Recente end-to-end leermethoden vertalen ruwe visuele observaties direct naar stuursignalen of trajecten, wat een grotere prestaties en efficiëntie in open-wereldomgevingen belooft. Echter, de meeste bestaande end-to-end methoden blijven afhankelijk van aparte lokalisatiemodules die accurate extrinsieke sensorkalibratie vereisen voor toestandsschatting, wat de generalisatie over verschillende robotconfiguraties en omgevingen beperkt. Wij introduceren LoGoPlanner, een op lokalisatie gebaseerd end-to-end navigatieraamwerk dat deze beperkingen aanpakt door: (1) het finetunen van een visueel-geometrische backbone met lange-termijnhorizon om voorspellingen te gronden in absolute metrieke schaal, waardoor impliciete toestandsschatting voor accurate lokalisatie wordt verschaft; (2) het reconstrueren van omringende scènegeometrie uit historische observaties om dichte, fijnmazige omgevingsbewustzoning te leveren voor betrouwbare obstakelvermijding; en (3) het conditioneren van het beleid op impliciete geometrie opgestart door de bovengenoemde hulptaken, waardoor foutpropagatie wordt verminderd. Wij evalueren LoGoPlanner in zowel simulatie- als real-world settings, waar het volledig end-to-end ontwerp cumulatieve fouten vermindert terwijl metrieke-geometriegeheugen de planningsconsistentie en obstakelvermijding verbetert, wat leidt tot meer dan 27,3% verbetering ten opzichte van baseline-methoden met perfecte lokalisatie en sterke generalisatie over robotconfiguraties en omgevingen. De code en modellen zijn openbaar gemaakt op de https://steinate.github.io/logoplanner.github.io/{projectpagina}.
English
Trajectory planning in unstructured environments is a fundamental and challenging capability for mobile robots. Traditional modular pipelines suffer from latency and cascading errors across perception, localization, mapping, and planning modules. Recent end-to-end learning methods map raw visual observations directly to control signals or trajectories, promising greater performance and efficiency in open-world settings. However, most prior end-to-end approaches still rely on separate localization modules that depend on accurate sensor extrinsic calibration for self-state estimation, thereby limiting generalization across embodiments and environments. We introduce LoGoPlanner, a localization-grounded, end-to-end navigation framework that addresses these limitations by: (1) finetuning a long-horizon visual-geometry backbone to ground predictions with absolute metric scale, thereby providing implicit state estimation for accurate localization; (2) reconstructing surrounding scene geometry from historical observations to supply dense, fine-grained environmental awareness for reliable obstacle avoidance; and (3) conditioning the policy on implicit geometry bootstrapped by the aforementioned auxiliary tasks, thereby reducing error propagation.We evaluate LoGoPlanner in both simulation and real-world settings, where its fully end-to-end design reduces cumulative error while metric-aware geometry memory enhances planning consistency and obstacle avoidance, leading to more than a 27.3\% improvement over oracle-localization baselines and strong generalization across embodiments and environments. The code and models have been made publicly available on the https://steinate.github.io/logoplanner.github.io/{project page}.