GeoAgent: Georeferenzierung überall erlernen mit verstärkten geografischen Merkmalen
GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics
February 13, 2026
papers.authors: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI
papers.abstract
Dieses Papier stellt GeoAgent vor, ein Modell, das in der Lage ist, menschenähnlich zu argumentieren und feingranulare Adressschlussfolgerungen abzuleiten. Bisherige RL-basierte Methoden haben zwar Durchbrüche in Leistung und Interpretierbarkeit erzielt, werfen jedoch weiterhin Bedenken auf, da sie auf KI-generierten Chain-of-Thought-Daten (CoT) und Trainingsstrategien basieren, die mit geografischen Charakteristika im Konflikt stehen. Um diese Probleme zu adressieren, führen wir zunächst GeoSeek ein, einen neuen Geodatensatz, der von Geografieexperten und professionellen Spielern annotierte CoT-Daten umfasst. Darüber hinaus erforschen wir gründlich die inherenten Eigenschaften geografischer Aufgaben und schlagen eine Geo-Ähnlichkeitsbelohnung sowie eine Konsistenzbelohnung vor, die von einem Konsistenz-Agenten bewertet wird, um das Training zu unterstützen. Dies ermutigt das Modell, sich aus geografischer Perspektive korrekten Antworten anzunähern und dabei die Integrität und Konsistenz seines Argumentationsprozesses zu gewährleisten. Experimentelle Ergebnisse zeigen, dass GeoAgent bestehende Methoden und eine Reihe allgemeiner VLLMs über mehrere Granularitäten hinweg übertrifft und dabei Argumentationen generiert, die eng mit menschlichem Denken übereinstimmen.
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.