Met^2Net: Um Modelo de Previsão Espaço-Temporal em Duas Etapas Desacopladas para Sistemas Meteorológicos Complexos
Met^2Net: A Decoupled Two-Stage Spatio-Temporal Forecasting Model for Complex Meteorological Systems
July 23, 2025
Autores: Shaohan Li, Hao Yang, Min Chen, Xiaolin Qin
cs.AI
Resumo
O aumento da frequência de eventos climáticos extremos devido às mudanças climáticas globais exige previsões meteorológicas precisas. Recentemente, grandes avanços foram alcançados por métodos de ponta a ponta, graças às técnicas de aprendizado profundo, mas eles enfrentam limitações de inconsistência na representação da integração multivariável e dificuldades para capturar efetivamente a dependência entre variáveis, o que é necessário em sistemas climáticos complexos. Tratar diferentes variáveis como modalidades distintas e aplicar uma abordagem de treinamento em duas etapas a partir de modelos multimodais pode aliviar parcialmente esse problema, mas devido à incompatibilidade nas tarefas de treinamento entre as duas etapas, os resultados geralmente são subótimos. Para enfrentar esses desafios, propomos um método de treinamento implícito em duas etapas, configurando codificadores e decodificadores separados para cada variável. Especificamente, na primeira etapa, o Tradutor é congelado enquanto os Codificadores e Decodificadores aprendem um espaço latente compartilhado; na segunda etapa, os Codificadores e Decodificadores são congelados, e o Tradutor captura as interações entre variáveis para a previsão. Além disso, ao introduzir um mecanismo de autoatenção para a fusão multivariável no espaço latente, o desempenho alcança melhorias adicionais. Empiricamente, experimentos extensivos mostram o desempenho de ponta do nosso método. Especificamente, ele reduz o MSE para previsões de temperatura do ar próximo à superfície e umidade relativa em 28,82% e 23,39%, respectivamente. O código-fonte está disponível em https://github.com/ShremG/Met2Net.
English
The increasing frequency of extreme weather events due to global climate
change urges accurate weather prediction. Recently, great advances have been
made by the end-to-end methods, thanks to deep learning techniques,
but they face limitations of representation inconsistency in
multivariable integration and struggle to effectively capture the dependency
between variables, which is required in complex weather systems. Treating
different variables as distinct modalities and applying a two-stage
training approach from multimodal models can partially alleviate this issue,
but due to the inconformity in training tasks between the two stages, the
results are often suboptimal. To address these challenges, we propose an
implicit two-stage training method, configuring separate encoders and decoders
for each variable. In detailed, in the first stage, the Translator is frozen
while the Encoders and Decoders learn a shared latent space, in the second
stage, the Encoders and Decoders are frozen, and the Translator captures
inter-variable interactions for prediction. Besides, by introducing a
self-attention mechanism for multivariable fusion in the latent space, the
performance achieves further improvements. Empirically, extensive experiments
show the state-of-the-art performance of our method. Specifically, it reduces
the MSE for near-surface air temperature and relative humidity predictions by
28.82\% and 23.39\%, respectively. The source code is available at
https://github.com/ShremG/Met2Net.