GeoAgent: 強化学習による地理的特徴を用いた汎用位置推定手法
GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics
February 13, 2026
著者: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI
要旨
本論文では、人間に近い推論を行い、細粒度な住所結論を導出可能なGeoAgentモデルを提案する。従来の強化学習ベースの手法は性能と解釈可能性において画期的な成果を達成してきたが、地理的特性と矛盾するAI生成の連鎖思考(CoT)データと学習戦略への依存が依然として課題となっている。これらの問題を解決するため、我々はまず地理専門家とプロフェッショナルプレイヤーによって注釈付けされたCoTデータから構成される新しい測位データセットGeoSeekを導入する。さらに、地理タスクの内在的特性を徹底的に調査し、地理的類似性報酬と一貫性エージェントによって評価される一貫性報酬を学習支援として提案する。これにより、モデルが地理的観点から正解へ収束すると同時に、推論プロセスの完全性と一貫性が保証される。実験結果では、GeoAgentが複数の粒度において既存手法および一連の汎用VLLMを凌駕し、人間の思考に極めて近い推論を生成することを示す。
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.