Incorporação Global e Densa da Terra: Major TOM Flutuando no Espaço Latente
Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space
December 7, 2024
Autores: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI
Resumo
Com o aumento contínuo dos volumes de dados de observação da Terra presentes nos arquivos de grandes programas como o Copernicus, há uma crescente necessidade de representações vetoriais eficientes dos dados brutos subjacentes. A abordagem de extrair representações de características de redes neurais profundas pré-treinadas é uma abordagem poderosa que pode fornecer abstrações semânticas dos dados de entrada. No entanto, a forma como isso é feito para arquivos de imagens contendo dados geoespaciais ainda não foi definida. Neste trabalho, é proposta uma extensão a um projeto comunitário existente, Major TOM, focado na provisão e padronização de conjuntos de dados prontos para IA, abertos e gratuitos para observação da Terra. Além disso, quatro conjuntos de dados de incorporação global e densa são disponibilizados abertamente e gratuitamente juntamente com a publicação deste manuscrito, resultando no conjunto de dados global aberto mais abrangente de incorporações visuais geoespaciais em termos da superfície terrestre coberta.
English
With the ever-increasing volumes of the Earth observation data present in the
archives of large programmes such as Copernicus, there is a growing need for
efficient vector representations of the underlying raw data. The approach of
extracting feature representations from pretrained deep neural networks is a
powerful approach that can provide semantic abstractions of the input data.
However, the way this is done for imagery archives containing geospatial data
has not yet been defined. In this work, an extension is proposed to an existing
community project, Major TOM, focused on the provision and standardization of
open and free AI-ready datasets for Earth observation. Furthermore, four global
and dense embedding datasets are released openly and for free along with the
publication of this manuscript, resulting in the most comprehensive global open
dataset of geospatial visual embeddings in terms of covered Earth's surface.Summary
AI-Generated Summary