다중 조명 화이트 밸런스 보정을 위한 이미지 융합 재고찰
Revisiting Image Fusion for Multi-Illuminant White-Balance Correction
March 18, 2025
저자: David Serrano-Lozano, Aditya Arora, Luis Herranz, Konstantinos G. Derpanis, Michael S. Brown, Javier Vazquez-Corral
cs.AI
초록
다중 광원이 존재하는 장면에서의 화이트 밸런스(WB) 보정은 컴퓨터 비전 분야에서 지속적인 과제로 남아 있습니다. 최근의 방법들은 신경망이 미리 정의된 WB 프리셋으로 처리된 입력 이미지의 여러 sRGB 버전을 선형적으로 혼합하는 융합 기반 접근 방식을 탐구했습니다. 그러나 우리는 이러한 방법들이 일반적인 다중 광원 시나리오에 대해 최적이 아니라는 것을 입증합니다. 또한, 기존의 융합 기반 방법들은 전용 다중 광원 이미지가 부족한 sRGB WB 데이터셋에 의존함으로써 학습과 평가 모두에 제한을 받고 있습니다. 이러한 문제를 해결하기 위해 우리는 두 가지 주요 기여를 제안합니다. 첫째, sRGB WB 프리셋 간의 공간적 의존성을 효과적으로 포착하는 효율적인 트랜스포머 기반 모델을 제안하여 선형 융합 기법을 크게 개선합니다. 둘째, 5가지 다른 WB 설정으로 렌더링된 16,000개 이상의 sRGB 이미지와 WB 보정 이미지로 구성된 대규모 다중 광원 데이터셋을 소개합니다. 우리의 방법은 새로운 다중 광원 이미지 융합 데이터셋에서 기존 기술 대비 최대 100%의 성능 향상을 달성합니다.
English
White balance (WB) correction in scenes with multiple illuminants remains a
persistent challenge in computer vision. Recent methods explored fusion-based
approaches, where a neural network linearly blends multiple sRGB versions of an
input image, each processed with predefined WB presets. However, we demonstrate
that these methods are suboptimal for common multi-illuminant scenarios.
Additionally, existing fusion-based methods rely on sRGB WB datasets lacking
dedicated multi-illuminant images, limiting both training and evaluation. To
address these challenges, we introduce two key contributions. First, we propose
an efficient transformer-based model that effectively captures spatial
dependencies across sRGB WB presets, substantially improving upon linear fusion
techniques. Second, we introduce a large-scale multi-illuminant dataset
comprising over 16,000 sRGB images rendered with five different WB settings,
along with WB-corrected images. Our method achieves up to 100\% improvement
over existing techniques on our new multi-illuminant image fusion dataset.