ChatPaper.aiChatPaper

地球のグローバルで密な埋め込み: メジャーなTOMが潜在空間に浮かぶ

Global and Dense Embeddings of Earth: Major TOM Floating in the Latent Space

December 7, 2024
著者: Mikolaj Czerkawski, Marcin Kluczek, Jędrzej S. Bojanowski
cs.AI

要旨

地球観測データの膨大なアーカイブ、例えばCopernicusのような大規模プログラムに存在するデータ量が増加するにつれ、基礎となる生データの効率的なベクトル表現へのニーズが高まっています。事前に訓練された深層ニューラルネットワークから特徴表現を抽出するアプローチは、入力データの意味論的抽象化を提供できる強力な手法です。ただし、地理空間データを含む画像アーカイブに対してこの手法がどのように行われるかはまだ定義されていません。本研究では、地球観測のためのオープンで無料のAI対応データセットの提供と標準化に焦点を当てた既存のコミュニティプロジェクトであるMajor TOMに拡張を提案します。さらに、この論文の公開と同時に、4つのグローバルで密な埋め込みデータセットが無償で公開され、地球全体の表面をカバーする観点で最も包括的なグローバルな地理空間ビジュアル埋め込みデータセットが提供されます。
English
With the ever-increasing volumes of the Earth observation data present in the archives of large programmes such as Copernicus, there is a growing need for efficient vector representations of the underlying raw data. The approach of extracting feature representations from pretrained deep neural networks is a powerful approach that can provide semantic abstractions of the input data. However, the way this is done for imagery archives containing geospatial data has not yet been defined. In this work, an extension is proposed to an existing community project, Major TOM, focused on the provision and standardization of open and free AI-ready datasets for Earth observation. Furthermore, four global and dense embedding datasets are released openly and for free along with the publication of this manuscript, resulting in the most comprehensive global open dataset of geospatial visual embeddings in terms of covered Earth's surface.

Summary

AI-Generated Summary

PDF82December 10, 2024