ChatPaper.aiChatPaper

OlmoEarth: Stabiele Latente Beeldmodellering voor Multimodale Aardobservatie

OlmoEarth: Stable Latent Image Modeling for Multimodal Earth Observation

November 17, 2025
Auteurs: Henry Herzog, Favyen Bastani, Yawen Zhang, Gabriel Tseng, Joseph Redmon, Hadrien Sablon, Ryan Park, Jacob Morrison, Alexandra Buraczynski, Karen Farley, Joshua Hansen, Andrew Howe, Patrick Alan Johnson, Mark Otterlee, Ted Schmitt, Hunter Pitelka, Stephen Daspit, Rachel Ratner, Christopher Wilhelm, Sebastian Wood, Mike Jacobi, Hannah Kerner, Evan Shelhamer, Ali Farhadi, Ranjay Krishna, Patrick Beukema
cs.AI

Samenvatting

Aardobservatiegegevens vormen een unieke uitdaging: ze zijn ruimtelijk zoals afbeeldingen, sequentieel zoals video of tekst, en sterk multimodaal. Wij presenteren OlmoEarth: een multimodaal, spatio-temporeel foundationmodel dat gebruikmaakt van een nieuwe formulering voor zelfsupervised leren, een nieuwe maskingstrategie en een nieuw verliesfunctieontwerp, allemaal ontwikkeld voor het aardobservatiedomein. OlmoEarth behaalt state-of-the-art prestaties in vergelijking met 12 andere foundationmodellen, getest op diverse onderzoeksbenchmarks en real-world taken van externe partners. Bij de evaluatie van embeddings behaalt OlmoEarth de beste prestatie op 15 van de 24 taken, en met volledige fine-tuning is het de beste op 19 van de 29 taken. Wij zetten OlmoEarth in als de backbone van een end-to-end platform voor gegevensverzameling, labeling, training en inferentie van aardobservatiemodellen. Het OlmoEarth Platform brengt geavanceerde foundationmodellen en krachtige data management tools binnen handbereik van non-profits en NGO's die werken aan het oplossen van 's werelds grootste problemen. De OlmoEarth-broncode, trainingsgegevens en vooraf getrainde gewichten zijn beschikbaar op https://github.com/allenai/olmoearth_pretrain.
English
Earth observation data presents a unique challenge: it is spatial like images, sequential like video or text, and highly multimodal. We present OlmoEarth: a multimodal, spatio-temporal foundation model that employs a novel self-supervised learning formulation, masking strategy, and loss all designed for the Earth observation domain. OlmoEarth achieves state-of-the-art performance compared to 12 other foundation models across a variety of research benchmarks and real-world tasks from external partners. When evaluating embeddings OlmoEarth achieves the best performance on 15 out of 24 tasks, and with full fine-tuning it is the best on 19 of 29 tasks. We deploy OlmoEarth as the backbone of an end-to-end platform for data collection, labeling, training, and inference of Earth observation models. The OlmoEarth Platform puts frontier foundation models and powerful data management tools into the hands of non-profits and NGOs working to solve the world's biggest problems. OlmoEarth source code, training data, and pre-trained weights are available at https://github.com/allenai/olmoearth_pretrain{https://github.com/allenai/olmoearth_pretrain}.
PDF92December 1, 2025