ChatPaper.aiChatPaper

Wereldwijde en Dichte Embeddings van de Aarde: Major TOM zwevend in de Latente Ruimte

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
Auteurs: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

Samenvatting

Met de voortdurend toenemende volumes aan aardobservatiegegevens in de archieven van grote programma's zoals Copernicus, groeit de behoefte aan efficiënte vectorrepresentaties van de onderliggende ruwe data. De benadering van het extraheren van kenmerkrepresentaties uit vooraf getrainde diepe neurale netwerken is een krachtige methode die semantische abstracties van de invoerdata kan bieden. Echter, de manier waarop dit wordt gedaan voor beeldarchieven met geospatiale data is nog niet gedefinieerd. In dit werk wordt een uitbreiding voorgesteld van een bestaand gemeenschapsproject, Major TOM, gericht op het verstrekken en standaardiseren van open en gratis AI-gereed datasets voor aardobservatie. Bovendien worden vier wereldwijde en dichte inbeddingsdatasets openlijk en gratis vrijgegeven samen met de publicatie van dit manuscript, resulterend in de meest uitgebreide wereldwijde open dataset van geospatiale visuele inbeddingen wat betreft het gedekte aardoppervlak.
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.
PDF82December 10, 2024