ChatPaper.aiChatPaper

MAESTRO: AutoCodificadores Enmascarados para Datos de Observación de la Tierra Multimodales, Multitemporales y Multiespectrales

MAESTRO: Masked AutoEncoders for Multimodal, Multitemporal, and Multispectral Earth Observation Data

August 14, 2025
Autores: Antoine Labatie, Michael Vaccaro, Nina Lardiere, Anatol Garioud, Nicolas Gonthier
cs.AI

Resumen

El aprendizaje autosupervisado tiene un gran potencial para la teledetección, pero los métodos estándar de autosupervisión deben adaptarse a las características únicas de los datos de observación terrestre. Damos un paso en esta dirección realizando una evaluación exhaustiva de estrategias de fusión y esquemas de normalización de objetivos de reconstrucción para datos de observación terrestre multimodales, multitemporales y multiespectrales. Basándonos en nuestros hallazgos, proponemos MAESTRO, una novedosa adaptación del Autoencoder Enmascarado, que incluye estrategias de fusión optimizadas y un esquema de normalización de objetivos personalizado que introduce un previo espectral como señal de autosupervisión. Evaluado en cuatro conjuntos de datos de observación terrestre, MAESTRO establece un nuevo estado del arte en tareas que dependen fuertemente de dinámicas multitemporales, mientras se mantiene altamente competitivo en tareas dominadas por una única modalidad monotemporal. El código para reproducir todos nuestros experimentos está disponible en https://github.com/ignf/maestro.
English
Self-supervised learning holds great promise for remote sensing, but standard self-supervised methods must be adapted to the unique characteristics of Earth observation data. We take a step in this direction by conducting a comprehensive benchmark of fusion strategies and reconstruction target normalization schemes for multimodal, multitemporal, and multispectral Earth observation data. Based on our findings, we propose MAESTRO, a novel adaptation of the Masked Autoencoder, featuring optimized fusion strategies and a tailored target normalization scheme that introduces a spectral prior as a self-supervisory signal. Evaluated on four Earth observation datasets, MAESTRO sets a new state-of-the-art on tasks that strongly rely on multitemporal dynamics, while remaining highly competitive on tasks dominated by a single mono-temporal modality. Code to reproduce all our experiments is available at https://github.com/ignf/maestro.
PDF32August 18, 2025