WGAST: 시공간 융합을 통한 일별 10m 지표면 온도 추정을 위한 약지도 생성 네트워크
WGAST: Weakly-Supervised Generative Network for Daily 10 m Land Surface Temperature Estimation via Spatio-Temporal Fusion
August 8, 2025
저자: Sofiane Bouaziz, Adel Hafiane, Raphael Canals, Rachid Nedjai
cs.AI
초록
도시화, 기후 변화, 그리고 농업 스트레스는 정확하고 시의적절한 환경 모니터링에 대한 수요를 증가시키고 있습니다. 지표면 온도(LST)는 이러한 맥락에서 중요한 변수이며, 원격 탐사 위성으로부터 획득됩니다. 그러나 이러한 시스템은 공간 해상도와 시간 해상도 사이의 트레이드오프에 직면해 있습니다. 시공간 융합 방법이 유망한 해결책을 제공하지만, 10m 해상도의 일일 LST 추정을 다룬 연구는 거의 없습니다. 본 연구에서는 Terra MODIS, Landsat 8, 그리고 Sentinel-2의 시공간 융합을 통해 일일 10m LST를 추정하기 위한 약한 감독 생성 네트워크인 WGAST를 제안합니다. WGAST는 이 작업을 위해 설계된 최초의 종단간 딥러닝 프레임워크입니다. 이는 조건부 생성적 적대 네트워크 아키텍처를 채택하며, 생성기는 특징 추출, 융합, LST 재구성, 그리고 노이즈 억제의 네 단계로 구성됩니다. 첫 번째 단계에서는 입력 데이터로부터 다중 수준의 잠재 표현을 추출하기 위해 일련의 인코더를 사용하며, 두 번째 단계에서는 코사인 유사도, 정규화, 그리고 시간적 주의 메커니즘을 사용하여 이러한 특징을 융합합니다. 세 번째 단계에서는 융합된 특징을 고해상도 LST로 디코딩한 후, 가우시안 필터를 사용하여 고주파 노이즈를 억제합니다. 학습은 물리적 평균 원칙에 기반한 약한 감독 전략을 따르며, PatchGAN 판별자에 의해 강화됩니다. 실험 결과, WGAST는 양적 및 질적 평가 모두에서 기존 방법들을 능가하는 성능을 보였습니다. 최고 성능의 베이스라인과 비교하여, WGAST는 평균적으로 RMSE를 17.18% 감소시키고 SSIM을 11.00% 향상시켰습니다. 또한, WGAST는 구름에 의한 LST에 강건하며, 33개의 지상 센서에 대한 검증을 통해 미세 규모의 열 패턴을 효과적으로 포착합니다. 코드는 https://github.com/Sofianebouaziz1/WGAST.git에서 확인할 수 있습니다.
English
Urbanization, climate change, and agricultural stress are increasing the
demand for precise and timely environmental monitoring. Land Surface
Temperature (LST) is a key variable in this context and is retrieved from
remote sensing satellites. However, these systems face a trade-off between
spatial and temporal resolution. While spatio-temporal fusion methods offer
promising solutions, few have addressed the estimation of daily LST at 10 m
resolution. In this study, we present WGAST, a Weakly-Supervised Generative
Network for Daily 10 m LST Estimation via Spatio-Temporal Fusion of Terra
MODIS, Landsat 8, and Sentinel-2. WGAST is the first end-to-end deep learning
framework designed for this task. It adopts a conditional generative
adversarial architecture, with a generator composed of four stages: feature
extraction, fusion, LST reconstruction, and noise suppression. The first stage
employs a set of encoders to extract multi-level latent representations from
the inputs, which are then fused in the second stage using cosine similarity,
normalization, and temporal attention mechanisms. The third stage decodes the
fused features into high-resolution LST, followed by a Gaussian filter to
suppress high-frequency noise. Training follows a weakly supervised strategy
based on physical averaging principles and reinforced by a PatchGAN
discriminator. Experiments demonstrate that WGAST outperforms existing methods
in both quantitative and qualitative evaluations. Compared to the
best-performing baseline, on average, WGAST reduces RMSE by 17.18% and improves
SSIM by 11.00%. Furthermore, WGAST is robust to cloud-induced LST and
effectively captures fine-scale thermal patterns, as validated against 33
ground-based sensors. The code is available at
https://github.com/Sofianebouaziz1/WGAST.git.