ChatPaper.aiChatPaper

Incorporação Global e Densa da Terra: Major TOM Flutuando no Espaço Latente

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
Autores: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

Resumo

Com o aumento contínuo dos volumes de dados de observação da Terra presentes nos arquivos de grandes programas como o Copernicus, há uma crescente necessidade de representações vetoriais eficientes dos dados brutos subjacentes. A abordagem de extrair representações de características de redes neurais profundas pré-treinadas é uma abordagem poderosa que pode fornecer abstrações semânticas dos dados de entrada. No entanto, a forma como isso é feito para arquivos de imagens contendo dados geoespaciais ainda não foi definida. Neste trabalho, é proposta uma extensão a um projeto comunitário existente, Major TOM, focado na provisão e padronização de conjuntos de dados prontos para IA, abertos e gratuitos para observação da Terra. Além disso, quatro conjuntos de dados de incorporação global e densa são disponibilizados abertamente e gratuitamente juntamente com a publicação deste manuscrito, resultando no conjunto de dados global aberto mais abrangente de incorporações visuais geoespaciais em termos da superfície terrestre coberta.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF82December 10, 2024