ChatPaper.aiChatPaper

GeoAgent: Aprendizaje de Geolocalización Universal mediante Características Geográficas Reforzadas

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

February 13, 2026
Autores: Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou
cs.AI

Resumen

Este artículo presenta GeoAgent, un modelo capaz de razonar estrechamente con humanos y derivar conclusiones de direcciones de grano fino. Los métodos anteriores basados en RL han logrado avances en rendimiento e interpretabilidad, pero aún generan inquietudes debido a su dependencia de datos de cadena de pensamiento (CoT) generados por IA y estrategias de entrenamiento que entran en conflicto con las características geográficas. Para abordar estos problemas, primero presentamos GeoSeek, un nuevo conjunto de datos de geolocalización que comprende datos CoT anotados por expertos en geografía y jugadores profesionales. Además, exploramos exhaustivamente las características inherentes de las tareas geográficas y proponemos una recompensa de similitud geográfica y una recompensa de consistencia evaluada por un agente de consistencia para ayudar en el entrenamiento. Esto incentiva al modelo a converger hacia respuestas correctas desde una perspectiva geográfica, garantizando al mismo tiempo la integridad y coherencia de su proceso de razonamiento. Los resultados experimentales muestran que GeoAgent supera a los métodos existentes y a una serie de VLLMs generales en múltiples escalas, generando un razonamiento que se alinea estrechamente con el humano.
English
This paper presents GeoAgent, a model capable of reasoning closely with humans and deriving fine-grained address conclusions. Previous RL-based methods have achieved breakthroughs in performance and interpretability but still remain concerns because of their reliance on AI-generated chain-of-thought (CoT) data and training strategies, which conflict with geographic characteristics. To address these issues, we first introduce GeoSeek, a new geolocation dataset comprising CoT data annotated by geographic experts and professional players. We further thoroughly explore the inherent characteristics of geographic tasks and propose a geo-similarity reward and a consistency reward assessed by a consistency agent to assist training. This encourages the model to converge towards correct answers from a geographic perspective while ensuring the integrity and consistency of its reasoning process. Experimental results show that GeoAgent outperforms existing methods and a series of general VLLMs across multiple grains, while generating reasoning that closely aligns with humans.
PDF192February 17, 2026