ChatPaper.aiChatPaper

GeoAgent : Apprentissage de la géolocalisation universelle par les caractéristiques géographiques renforcées

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

February 13, 2026
papers.authors: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI

papers.abstract

Ce document présente GeoAgent, un modèle capable de raisonner de manière proche des humains et de déduire des adresses granulaires. Les méthodes précédentes basées sur l'apprentissage par renforcement ont réalisé des percées en performances et interprétabilité, mais soulèvent encore des préoccupations en raison de leur dépendance aux données de chaîne de pensée générées par IA et à des stratégies d'entraînement qui entrent en conflit avec les caractéristiques géographiques. Pour résoudre ces problèmes, nous introduisons d'abord GeoSeek, un nouveau jeu de données de géolocalisation comprenant des chaînes de pensée annotées par des experts géographes et des joueurs professionnels. Nous explorons ensuite minutieusement les caractéristiques inhérentes aux tâches géographiques et proposons une récompense de similarité géographique ainsi qu'une récompense de cohérence évaluée par un agent de cohérence pour assister l'entraînement. Cette approche encourage le modèle à converger vers des réponses correctes d'un point de vue géographique tout en garantissant l'intégrité et la cohérence de son processus de raisonnement. Les résultats expérimentaux montrent que GeoAgent surpasse les méthodes existantes et une série de grands modèles linguistiques visuels généraux à plusieurs niveaux de granularité, tout en générant un raisonnement étroitement aligné sur celui des humains.
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.
PDF192February 17, 2026