ChatPaper.aiChatPaper

GCC : Constance de Couleur Générative par Diffusion d'une Mire Chromatique

GCC: Generative Color Constancy via Diffusing a Color Checker

February 24, 2025
Auteurs: Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
cs.AI

Résumé

Les méthodes de constance des couleurs peinent souvent à généraliser leur performance à travers différents capteurs d'appareils photo en raison de leurs sensibilités spectrales variables. Nous présentons GCC, qui exploite des modèles de diffusion pour intégrer des mires colorimétriques dans les images afin d'estimer l'éclairage. Nos innovations clés incluent : (1) une approche d'inférence déterministe en une seule étape qui intègre des mires reflétant l'éclairage de la scène, (2) une technique de décomposition Laplacienne qui préserve la structure des mires tout en permettant une adaptation des couleurs dépendante de l'éclairage, et (3) une stratégie d'augmentation de données basée sur des masques pour gérer les annotations imprécises des mires colorimétriques. GCC démontre une robustesse supérieure dans des scénarios multi-capteurs, atteignant des taux d'erreur dans les pires 25% de 5,15{\deg} et 4,32{\deg} lors d'évaluations bidirectionnelles, établissant ainsi un nouvel état de l'art. Ces résultats mettent en évidence la stabilité et la capacité de généralisation de notre méthode face à différentes caractéristiques de capteurs, sans nécessiter d'entraînement spécifique à chaque capteur, en faisant une solution polyvalente pour des applications réelles.
English
Color constancy methods often struggle to generalize across different camera sensors due to varying spectral sensitivities. We present GCC, which leverages diffusion models to inpaint color checkers into images for illumination estimation. Our key innovations include (1) a single-step deterministic inference approach that inpaints color checkers reflecting scene illumination, (2) a Laplacian decomposition technique that preserves checker structure while allowing illumination-dependent color adaptation, and (3) a mask-based data augmentation strategy for handling imprecise color checker annotations. GCC demonstrates superior robustness in cross-camera scenarios, achieving state-of-the-art worst-25% error rates of 5.15{\deg} and 4.32{\deg} in bi-directional evaluations. These results highlight our method's stability and generalization capability across different camera characteristics without requiring sensor-specific training, making it a versatile solution for real-world applications.

Summary

AI-Generated Summary

PDF282February 25, 2025