低レベル視覚におけるグローバルな測光アライメントについて
On the Global Photometric Alignment for Low-Level Vision
April 9, 2026
著者: Mingjia Li, Tianle Du, Hainuo Wang, Qiming Hu, Xiaojie Guo
cs.AI
要旨
教師あり低レベル視覚モデルは、ペア化された参照画像に対する画素単位の損失に依存しているが、ペア化された訓練データセットにはペアごとの測光的な不一致(例えば、画像ペアごとに異なる大域的な輝度、色、ホワイトバランスのマッピングが要求される)が存在する。この不一致は、タスク本来の測光的変換(例:低照度画像強調)または意図しない取得時の変動(例:雨除去)を通じて生じ、いずれの場合も最適化における病理的な問題を引き起こす。標準的な再構成損失は、矛盾するペアごとの測光目標に対して不均衡に勾配配分を行い、内容復元に必要な勾配を圧迫してしまう。本論文ではこの問題を調査し、最小二乗分解の下で、予測と目標の残差における測光的成分と構造的成分が直交すること、そして空間的に密な測光的成分が勾配エネルギーを支配することを証明する。この分析に基づき、我々は測光的整合損失(PAL)を提案する。この柔軟な教師あり目的関数は、閉形式のアフィン色整合により不要な測光的差異を割り引くと同時に、復元に関連する教師情報を保持する。必要なのは共分散統計量とごく小さな行列の逆行列のみであり、オーバーヘッドは無視できる程度である。6つのタスク、16のデータセット、16のアーキテクチャにわたる実験で、PALは指標と汎化性能を一貫して向上させた。実装は付録に記載する。
English
Supervised low-level vision models rely on pixel-wise losses against paired references, yet paired training sets exhibit per-pair photometric inconsistency, say, different image pairs demand different global brightness, color, or white-balance mappings. This inconsistency enters through task-intrinsic photometric transfer (e.g., low-light enhancement) or unintended acquisition shifts (e.g., de-raining), and in either case causes an optimization pathology. Standard reconstruction losses allocate disproportionate gradient budget to conflicting per-pair photometric targets, crowding out content restoration. In this paper, we investigate this issue and prove that, under least-squares decomposition, the photometric and structural components of the prediction-target residual are orthogonal, and that the spatially dense photometric component dominates the gradient energy. Motivated by this analysis, we propose Photometric Alignment Loss (PAL). This flexible supervision objective discounts nuisance photometric discrepancy via closed-form affine color alignment while preserving restoration-relevant supervision, requiring only covariance statistics and tiny matrix inversion with negligible overhead. Across 6 tasks, 16 datasets, and 16 architectures, PAL consistently improves metrics and generalization. The implementation is in the appendix.