ChatPaper.aiChatPaper

GeoAgent: 강화된 지리적 특성을 활용한 전 지구적 위치 추정 학습

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

February 13, 2026
저자: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI

초록

본 논문은 인간과 유사한 추론을 수행하며 세분화된 주소 결론을 도출할 수 있는 모델인 GeoAgent를 제시한다. 기존 RL 기반 방법들은 성능과 해석 가능성에서 획기적인 발전을 이루었으나, AI 생성 CoT(Chain-of-Thought) 데이터와 훈련 전략에 의존하기 때문에 지리적 특성과 상충되어 한계가 남아있다. 이러한 문제를 해결하기 위해 우리는 먼저 지리 전문가와 전문 플레이어가 주석을 단 CoT 데이터로 구성된 새로운 지리 위치 데이터셋인 GeoSeek을 소개한다. 더 나아가 지리 작업의 본질적 특성을 체계적으로 탐구하고, 지리 유사도 보상과 일관성 에이전트에 의해 평가되는 일관성 보상을 훈련에 활용하는 방안을 제안한다. 이를 통해 모델이 지리적 관점에서 정답으로 수렴하도록 유도함과 동시에 추론 과정의 무결성과 일관성을 보장한다. 실험 결과, GeoAgent는 다양한 세분도 수준에서 기존 방법과 일련의 범용 VLLM을 능가하며 인간과 밀접하게 일치하는 추론을 생성하는 것으로 나타났다.
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.
PDF192February 17, 2026