ChatPaper.aiChatPaper

Incorporation globale et dense de la Terre : Major TOM flottant dans l'espace latent

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
Auteurs: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

Résumé

Avec l'augmentation constante des volumes de données d'observation de la Terre présents dans les archives de grands programmes tels que Copernicus, il y a un besoin croissant de représentations vectorielles efficaces des données brutes sous-jacentes. L'approche consistant à extraire des représentations de caractéristiques à partir de réseaux neuronaux profonds pré-entraînés est une approche puissante qui peut fournir des abstractions sémantiques des données d'entrée. Cependant, la manière dont cela est fait pour les archives d'imagerie contenant des données géospatiales n'a pas encore été définie. Dans ce travail, une extension est proposée à un projet communautaire existant, Major TOM, axé sur la fourniture et la normalisation de jeux de données ouverts et gratuits prêts pour l'IA pour l'observation de la Terre. De plus, quatre ensembles de données d'incorporation globaux et denses sont publiés ouvertement et gratuitement en même temps que la publication de ce manuscrit, aboutissant au jeu de données ouvert mondial le plus complet d'incorporations visuelles géospatiales en termes de surface terrestre couverte.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF82December 10, 2024