ChatPaper.aiChatPaper

Incrustaciones Globales y Densas de la Tierra: Major TOM Flotando en el Espacio Latente

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
Autores: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

Resumen

Con el creciente volumen de datos de observación de la Tierra presentes en los archivos de grandes programas como Copernicus, hay una creciente necesidad de representaciones vectoriales eficientes de los datos brutos subyacentes. El enfoque de extraer representaciones de características de redes neuronales profundas preentrenadas es un enfoque poderoso que puede proporcionar abstracciones semánticas de los datos de entrada. Sin embargo, la forma en que se realiza esto para archivos de imágenes que contienen datos geoespaciales aún no ha sido definida. En este trabajo, se propone una extensión a un proyecto comunitario existente, Major TOM, centrado en la provisión y estandarización de conjuntos de datos AI listos para la observación de la Tierra, abiertos y gratuitos. Además, se publican abierta y gratuitamente cuatro conjuntos de datos de incrustación globales y densos junto con la publicación de este manuscrito, lo que resulta en el conjunto de datos global abierto más completo de incrustaciones visuales geoespaciales en términos de la superficie terrestre cubierta.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF82December 10, 2024