SEEDS: Emulação de Conjuntos de Previsão do Tempo com Modelos de Difusão
SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models
June 24, 2023
Autores: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI
Resumo
A previsão probabilística é crucial para a tomada de decisões sob incerteza sobre o clima futuro. A abordagem predominante é usar um conjunto de previsões para representar e quantificar a incerteza na previsão numérica operacional do tempo. No entanto, a geração de conjuntos é computacionalmente custosa. Neste artigo, propomos gerar previsões de conjunto em escala, aproveitando os avanços recentes em inteligência artificial generativa. Nossa abordagem aprende um modelo probabilístico de difusão baseado em dados a partir do conjunto de reanálise de 5 membros do GEFS. O modelo pode então ser amostrado de forma eficiente para produzir previsões meteorológicas realistas, condicionadas a alguns membros do sistema operacional de previsão do GEFS. Os conjuntos gerados têm habilidade preditiva semelhante ao conjunto completo de 31 membros do GEFS, avaliado em relação à reanálise ERA5, e emulam bem as estatísticas de grandes conjuntos baseados em física. Também aplicamos a mesma metodologia para desenvolver um modelo de difusão para pós-processamento generativo: o modelo aprende diretamente a corrigir vieses presentes no sistema de previsão emulado, utilizando dados de reanálise como rótulos durante o treinamento. Os conjuntos gerados por este modelo de pós-processamento generativo mostram maior confiabilidade e precisão, particularmente na classificação de eventos extremos. Em geral, eles são mais confiáveis e preveem a probabilidade de clima extremo com maior precisão do que o conjunto operacional do GEFS. Nossos modelos alcançam esses resultados com menos de 1/10 do custo computacional incorrido pelo sistema operacional do GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty
about future weather. The dominant approach is to use an ensemble of forecasts
to represent and quantify uncertainty in operational numerical weather
prediction. However, generating ensembles is computationally costly. In this
paper, we propose to generate ensemble forecasts at scale by leveraging recent
advances in generative artificial intelligence. Our approach learns a
data-driven probabilistic diffusion model from the 5-member ensemble GEFS
reforecast dataset. The model can then be sampled efficiently to produce
realistic weather forecasts, conditioned on a few members of the operational
GEFS forecasting system. The generated ensembles have similar predictive skill
as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and
emulate well the statistics of large physics-based ensembles. We also apply the
same methodology to developing a diffusion model for generative
post-processing: the model directly learns to correct biases present in the
emulated forecasting system by leveraging reanalysis data as labels during
training. Ensembles from this generative post-processing model show greater
reliability and accuracy, particularly in extreme event classification. In
general, they are more reliable and forecast the probability of extreme weather
more accurately than the GEFS operational ensemble. Our models achieve these
results at less than 1/10th of the computational cost incurred by the
operational GEFS system.