Met^2Net : Un modèle de prévision spatio-temporelle à deux étapes découplées pour les systèmes météorologiques complexes
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
papers.authors: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
papers.abstract
L'augmentation de la fréquence des événements météorologiques extrêmes due au changement climatique global exige une prévision météorologique précise. Récemment, des progrès significatifs ont été réalisés grâce aux méthodes de bout en bout, notamment grâce aux techniques d'apprentissage profond. Cependant, ces méthodes rencontrent des limites liées à l'incohérence de représentation dans l'intégration multivariable et peinent à capturer efficacement les dépendances entre les variables, pourtant essentielles dans les systèmes météorologiques complexes. Traiter les différentes variables comme des modalités distinctes et appliquer une approche d'entraînement en deux étapes inspirée des modèles multimodaux peut partiellement atténuer ce problème. Néanmoins, en raison de l'incompatibilité des tâches d'entraînement entre les deux étapes, les résultats sont souvent sous-optimaux. Pour relever ces défis, nous proposons une méthode d'entraînement implicite en deux étapes, configurant des encodeurs et des décodeurs distincts pour chaque variable. Plus précisément, dans la première étape, le Traducteur est gelé tandis que les Encodeurs et les Décodeurs apprennent un espace latent partagé. Dans la deuxième étape, les Encodeurs et les Décodeurs sont gelés, et le Traducteur capture les interactions inter-variables pour la prédiction. De plus, en introduisant un mécanisme d'auto-attention pour la fusion multivariable dans l'espace latent, les performances sont encore améliorées. Empiriquement, des expériences approfondies démontrent les performances de pointe de notre méthode. Concrètement, elle réduit l'erreur quadratique moyenne (MSE) pour les prédictions de température de l'air près de la surface et d'humidité relative de 28,82 % et 23,39 %, respectivement. Le code source est disponible à l'adresse suivante : https://github.com/ShremG/Met2Net.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.