SEEDS: Emulazione degli Ensemble di Previsioni Meteorologiche con Modelli di Diffusione
SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models
June 24, 2023
Autori: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI
Abstract
La previsione probabilistica è cruciale per il processo decisionale in condizioni di incertezza riguardo al meteo futuro. L'approccio predominante consiste nell'utilizzare un insieme di previsioni per rappresentare e quantificare l'incertezza nella previsione numerica operativa del tempo. Tuttavia, la generazione di questi insiemi è computazionalmente costosa. In questo articolo, proponiamo di generare previsioni d'insieme su larga scala sfruttando i recenti progressi nell'intelligenza artificiale generativa. Il nostro approccio apprende un modello probabilistico basato sui dati, utilizzando il dataset di riprevisione a 5 membri del GEFS. Il modello può quindi essere campionato in modo efficiente per produrre previsioni meteorologiche realistiche, condizionate su pochi membri del sistema operativo di previsione GEFS. Gli insiemi generati mostrano una capacità predittiva simile a quella del completo insieme a 31 membri del GEFS, valutata rispetto alla rianalisi ERA5, e riproducono bene le statistiche degli insiemi fisicamente basati su larga scala. Applichiamo inoltre la stessa metodologia per sviluppare un modello di diffusione per la post-elaborazione generativa: il modello apprende direttamente a correggere i bias presenti nel sistema di previsione emulato, sfruttando i dati di rianalisi come etichette durante l'addestramento. Gli insiemi generati da questo modello di post-elaborazione mostrano una maggiore affidabilità e accuratezza, in particolare nella classificazione degli eventi estremi. In generale, sono più affidabili e prevedono con maggiore precisione la probabilità di eventi meteorologici estremi rispetto all'insieme operativo del GEFS. I nostri modelli raggiungono questi risultati con un costo computazionale inferiore a 1/10 rispetto a quello del sistema operativo GEFS.
English
Probabilistic forecasting is crucial to decision-making under uncertainty
about future weather. The dominant approach is to use an ensemble of forecasts
to represent and quantify uncertainty in operational numerical weather
prediction. However, generating ensembles is computationally costly. In this
paper, we propose to generate ensemble forecasts at scale by leveraging recent
advances in generative artificial intelligence. Our approach learns a
data-driven probabilistic diffusion model from the 5-member ensemble GEFS
reforecast dataset. The model can then be sampled efficiently to produce
realistic weather forecasts, conditioned on a few members of the operational
GEFS forecasting system. The generated ensembles have similar predictive skill
as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and
emulate well the statistics of large physics-based ensembles. We also apply the
same methodology to developing a diffusion model for generative
post-processing: the model directly learns to correct biases present in the
emulated forecasting system by leveraging reanalysis data as labels during
training. Ensembles from this generative post-processing model show greater
reliability and accuracy, particularly in extreme event classification. In
general, they are more reliable and forecast the probability of extreme weather
more accurately than the GEFS operational ensemble. Our models achieve these
results at less than 1/10th of the computational cost incurred by the
operational GEFS system.