Met^2Net: Un Modello a Due Stadi Disaccoppiato per la Previsione Spazio-Temporale di Sistemi Meteorologici Complessi
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
Autori: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
Abstract
La crescente frequenza di eventi meteorologici estremi dovuta al cambiamento climatico globale richiede previsioni meteorologiche accurate. Recentemente, sono stati compiuti notevoli progressi grazie ai metodi end-to-end, grazie alle tecniche di deep learning, ma questi si scontrano con limitazioni legate all'inconsistenza nella rappresentazione nell'integrazione multivariabile e faticano a catturare efficacemente le dipendenze tra le variabili, necessarie nei sistemi meteorologici complessi. Trattare diverse variabili come modalità distinte e applicare un approccio di addestramento in due fasi basato su modelli multimodali può parzialmente alleviare questo problema, ma a causa della mancata conformità nei compiti di addestramento tra le due fasi, i risultati sono spesso subottimali. Per affrontare queste sfide, proponiamo un metodo di addestramento implicito in due fasi, configurando encoder e decoder separati per ciascuna variabile. Nello specifico, nella prima fase, il Translator viene congelato mentre gli Encoder e i Decoder apprendono uno spazio latente condiviso; nella seconda fase, gli Encoder e i Decoder vengono congelati, e il Translator cattura le interazioni tra le variabili per la previsione. Inoltre, introducendo un meccanismo di self-attention per la fusione multivariabile nello spazio latente, le prestazioni ottengono ulteriori miglioramenti. Empiricamente, esperimenti estensivi dimostrano le prestazioni all'avanguardia del nostro metodo. In particolare, riduce l'MSE per le previsioni della temperatura dell'aria vicino alla superficie e dell'umidità relativa rispettivamente del 28,82% e del 23,39%. Il codice sorgente è disponibile all'indirizzo https://github.com/ShremG/Met2Net.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.