ChatPaper.aiChatPaper

GCC: Costanza del Colore Generativa tramite Diffusione di una Tavola dei Colori

GCC: Generative Color Constancy via Diffusing a Color Checker

February 24, 2025
Autori: Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
cs.AI

Abstract

I metodi di costanza del colore spesso faticano a generalizzare attraverso diversi sensori di fotocamera a causa delle variazioni nelle sensibilità spettrali. Presentiamo GCC, che sfrutta modelli di diffusione per ricostruire i cartelli colore nelle immagini per la stima dell'illuminazione. Le nostre principali innovazioni includono (1) un approccio di inferenza deterministico a singolo passo che ricostruisce i cartelli colore riflettendo l'illuminazione della scena, (2) una tecnica di decomposizione Laplaciana che preserva la struttura del cartello consentendo un adattamento del colore dipendente dall'illuminazione, e (3) una strategia di aumento dei dati basata su maschere per gestire annotazioni imprecise dei cartelli colore. GCC dimostra una robustezza superiore negli scenari cross-camera, raggiungendo tassi di errore peggiori del 25% all'avanguardia di 5,15° e 4,32° in valutazioni bidirezionali. Questi risultati evidenziano la stabilità e la capacità di generalizzazione del nostro metodo attraverso diverse caratteristiche delle fotocamere senza richiedere addestramenti specifici per il sensore, rendendolo una soluzione versatile per applicazioni nel mondo reale.
English
Color constancy methods often struggle to generalize across different camera sensors due to varying spectral sensitivities. We present GCC, which leverages diffusion models to inpaint color checkers into images for illumination estimation. Our key innovations include (1) a single-step deterministic inference approach that inpaints color checkers reflecting scene illumination, (2) a Laplacian decomposition technique that preserves checker structure while allowing illumination-dependent color adaptation, and (3) a mask-based data augmentation strategy for handling imprecise color checker annotations. GCC demonstrates superior robustness in cross-camera scenarios, achieving state-of-the-art worst-25% error rates of 5.15{\deg} and 4.32{\deg} in bi-directional evaluations. These results highlight our method's stability and generalization capability across different camera characteristics without requiring sensor-specific training, making it a versatile solution for real-world applications.

Summary

AI-Generated Summary

PDF282February 25, 2025