ChatPaper.aiChatPaper

Game4Loc : Un banc d'essai de géolocalisation UAV à partir de données de jeu

Game4Loc: A UAV Geo-Localization Benchmark from Game Data

September 25, 2024
Auteurs: Yuxiang Ji, Boyong He, Zhuoyue Tan, Liaoni Wu
cs.AI

Résumé

La technologie de géolocalisation basée sur la vision pour les UAV, servant de source secondaire d'informations GPS en plus des systèmes mondiaux de navigation par satellite (GNSS), peut encore fonctionner de manière indépendante dans un environnement sans GPS. Les méthodes récentes basées sur l'apprentissage profond attribuent cette tâche à la correspondance et à la recherche d'images. En récupérant des images de vue de drone dans une base de données d'images satellites géo-étiquetées, des informations de localisation approximatives peuvent être obtenues. Cependant, en raison des coûts élevés et des préoccupations en matière de confidentialité, il est généralement difficile d'obtenir de grandes quantités d'images de vue de drone d'une zone continue. Les ensembles de données de vue de drone existants sont principalement composés de photographies aériennes à petite échelle avec une forte hypothèse selon laquelle il existe une image de référence parfaitement alignée pour toute requête, laissant un écart significatif par rapport au scénario de localisation pratique. Dans ce travail, nous construisons un ensemble de données de géolocalisation UAV à grande portée et contiguë nommé GTA-UAV, présentant plusieurs altitudes de vol, attitudes, scènes et cibles en utilisant des jeux vidéo modernes. Sur la base de cet ensemble de données, nous introduisons une tâche de géolocalisation UAV plus pratique comprenant des correspondances partielles de données appariées entre vues croisées, et étendons la recherche au niveau de l'image à la localisation réelle en termes de distance (mètres). Pour la construction de paires de vues de drone et de vues satellites, nous adoptons une approche d'apprentissage contrastif basé sur le poids, qui permet un apprentissage efficace tout en évitant des étapes supplémentaires de correspondance post-traitement. Les expériences démontrent l'efficacité de nos données et de notre méthode d'entraînement pour la géolocalisation UAV, ainsi que les capacités de généralisation aux scénarios du monde réel.
English
The vision-based geo-localization technology for UAV, serving as a secondary source of GPS information in addition to the global navigation satellite systems (GNSS), can still operate independently in the GPS-denied environment. Recent deep learning based methods attribute this as the task of image matching and retrieval. By retrieving drone-view images in geo-tagged satellite image database, approximate localization information can be obtained. However, due to high costs and privacy concerns, it is usually difficult to obtain large quantities of drone-view images from a continuous area. Existing drone-view datasets are mostly composed of small-scale aerial photography with a strong assumption that there exists a perfect one-to-one aligned reference image for any query, leaving a significant gap from the practical localization scenario. In this work, we construct a large-range contiguous area UAV geo-localization dataset named GTA-UAV, featuring multiple flight altitudes, attitudes, scenes, and targets using modern computer games. Based on this dataset, we introduce a more practical UAV geo-localization task including partial matches of cross-view paired data, and expand the image-level retrieval to the actual localization in terms of distance (meters). For the construction of drone-view and satellite-view pairs, we adopt a weight-based contrastive learning approach, which allows for effective learning while avoiding additional post-processing matching steps. Experiments demonstrate the effectiveness of our data and training method for UAV geo-localization, as well as the generalization capabilities to real-world scenarios.

Summary

AI-Generated Summary

PDF82November 16, 2024