ChatPaper.aiChatPaper

GeoAgent: Обучение геолокации повсюду с использованием подкрепленных географических характеристик

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

February 13, 2026
Авторы: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI

Аннотация

В данной статье представлена модель GeoAgent, способная рассуждать в тесном соответствии с человеческим мышлением и делать детализированные выводы об адресах. Предыдущие методы, основанные на обучении с подкреплением (RL), достигли прорывов в производительности и интерпретируемости, однако сохраняются опасения из-за их зависимости на сгенерированных ИИ данных "цепочки рассуждений" (CoT) и стратегиях обучения, которые противоречат географическим особенностям. Для решения этих проблем мы сначала представляем GeoSeek — новый геолокационный набор данных, содержащий CoT-данные, аннотированные экспертами-географами и профессиональными игроками. Далее мы тщательно исследуем inherent characteristics географических задач и предлагаем geo-similarity reward (вознаграждение за географическое сходство) и consistency reward (вознаграждение за согласованность), оцениваемое агентом согласованности, для помощи в обучении. Это побуждает модель сходиться к правильным ответам с географической точки зрения, обеспечивая при этом целостность и последовательность её процесса рассуждений. Результаты экспериментов показывают, что GeoAgent превосходит существующие методы и ряд общих VLLM на различных уровнях детализации, генерируя при этом рассуждения, тесно согласованные с человеческими.
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.
PDF192February 17, 2026