Глобальные и плотные вложения Земли: Майор ТОМ, плавающий в латентном пространстве
Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space
December 7, 2024
Авторы: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI
Аннотация
С увеличивающимися объемами данных обсервации Земли, представленными в архивах крупных программ, таких как Copernicus, возрастает потребность в эффективных векторных представлениях исходных данных. Подход извлечения признаков из предварительно обученных глубоких нейронных сетей является мощным методом, способным обеспечить семантические абстракции входных данных. Однако способ, которым это делается для архивов изображений, содержащих геопространственные данные, пока не был определен. В данной работе предлагается расширение существующего сообщественного проекта Major TOM, сосредоточенного на предоставлении и стандартизации открытых и бесплатных наборов данных, готовых к использованию в области обсервации Земли с использованием искусственного интеллекта. Кроме того, вместе с публикацией данного документа были открыто и бесплатно опубликованы четыре глобальных и плотных набора данных встраивания, что привело к созданию наиболее полного глобального открытого набора данных геопространственных визуальных встраиваний по покрытию поверхности Земли.
English
With the ever-increasing volumes of the Earth observation data present in the
archives of large programmes such as Copernicus, there is a growing need for
efficient vector representations of the underlying raw data. The approach of
extracting feature representations from pretrained deep neural networks is a
powerful approach that can provide semantic abstractions of the input data.
However, the way this is done for imagery archives containing geospatial data
has not yet been defined. In this work, an extension is proposed to an existing
community project, Major TOM, focused on the provision and standardization of
open and free AI-ready datasets for Earth observation. Furthermore, four global
and dense embedding datasets are released openly and for free along with the
publication of this manuscript, resulting in the most comprehensive global open
dataset of geospatial visual embeddings in terms of covered Earth's surface.Summary
AI-Generated Summary