SEEDS: 확산 모델을 활용한 기상 예측 앙상블 에뮬레이션
SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models
June 24, 2023
저자: Lizao Li, Rob Carver, Ignacio Lopez-Gomez, Fei Sha, John Anderson
cs.AI
초록
확률적 예측은 미래 날씨에 대한 불확실성 하에서 의사결정에 있어 매우 중요하다. 현재 주류 접근법은 운영 수치 날씨 예측에서 불확실성을 표현하고 정량화하기 위해 앙상블 예측을 사용하는 것이다. 그러나 앙상블을 생성하는 것은 계산 비용이 많이 든다. 본 논문에서는 최근 생성 인공지능의 발전을 활용하여 대규모로 앙상블 예측을 생성하는 방법을 제안한다. 우리의 접근법은 5개 멤버로 구성된 GEFS 재예측 데이터셋에서 데이터 기반 확률적 확산 모델을 학습한다. 이 모델은 운영 GEFS 예측 시스템의 몇몇 멤버를 조건으로 하여 현실적인 날씨 예측을 효율적으로 생성할 수 있다. 생성된 앙상블은 ERA5 재분석 데이터를 기준으로 평가했을 때, 전체 GEFS 31개 멤버 앙상블과 유사한 예측 능력을 보이며, 대규모 물리 기반 앙상블의 통계를 잘 모방한다. 또한, 우리는 동일한 방법론을 적용하여 생성적 후처리를 위한 확산 모델을 개발하였다: 이 모델은 재분석 데이터를 훈련 중 레이블로 활용하여 모방된 예측 시스템에 존재하는 편향을 직접 교정하는 방법을 학습한다. 이 생성적 후처리 모델에서 생성된 앙상블은 특히 극단적 사건 분류에서 더 높은 신뢰성과 정확성을 보인다. 일반적으로, 이들은 GEFS 운영 앙상블보다 더 신뢰할 수 있으며 극단적 날씨의 확률을 더 정확하게 예측한다. 우리의 모델은 이러한 결과를 GEFS 운영 시스템의 계산 비용의 1/10 미만으로 달성한다.
English
Probabilistic forecasting is crucial to decision-making under uncertainty
about future weather. The dominant approach is to use an ensemble of forecasts
to represent and quantify uncertainty in operational numerical weather
prediction. However, generating ensembles is computationally costly. In this
paper, we propose to generate ensemble forecasts at scale by leveraging recent
advances in generative artificial intelligence. Our approach learns a
data-driven probabilistic diffusion model from the 5-member ensemble GEFS
reforecast dataset. The model can then be sampled efficiently to produce
realistic weather forecasts, conditioned on a few members of the operational
GEFS forecasting system. The generated ensembles have similar predictive skill
as the full GEFS 31-member ensemble, evaluated against ERA5 reanalysis, and
emulate well the statistics of large physics-based ensembles. We also apply the
same methodology to developing a diffusion model for generative
post-processing: the model directly learns to correct biases present in the
emulated forecasting system by leveraging reanalysis data as labels during
training. Ensembles from this generative post-processing model show greater
reliability and accuracy, particularly in extreme event classification. In
general, they are more reliable and forecast the probability of extreme weather
more accurately than the GEFS operational ensemble. Our models achieve these
results at less than 1/10th of the computational cost incurred by the
operational GEFS system.Summary
AI-Generated Summary