GCC: Constancia de Color Generativa mediante la Difusión de una Carta de Colores
GCC: Generative Color Constancy via Diffusing a Color Checker
February 24, 2025
Autores: Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
cs.AI
Resumen
Los métodos de constancia de color a menudo tienen dificultades para generalizar entre diferentes sensores de cámara debido a las variadas sensibilidades espectrales. Presentamos GCC, que aprovecha modelos de difusión para rellenar cartas de color en imágenes con el fin de estimar la iluminación. Nuestras innovaciones clave incluyen (1) un enfoque de inferencia determinística de un solo paso que rellena cartas de color que reflejan la iluminación de la escena, (2) una técnica de descomposición Laplaciana que preserva la estructura de la carta de color mientras permite la adaptación del color dependiente de la iluminación, y (3) una estrategia de aumento de datos basada en máscaras para manejar anotaciones imprecisas de cartas de color. GCC demuestra una robustez superior en escenarios de cámaras cruzadas, alcanzando tasas de error del peor 25% de vanguardia de 5.15° y 4.32° en evaluaciones bidireccionales. Estos resultados resaltan la estabilidad y capacidad de generalización de nuestro método a través de diferentes características de cámara sin requerir entrenamiento específico del sensor, convirtiéndolo en una solución versátil para aplicaciones del mundo real.
English
Color constancy methods often struggle to generalize across different camera
sensors due to varying spectral sensitivities. We present GCC, which leverages
diffusion models to inpaint color checkers into images for illumination
estimation. Our key innovations include (1) a single-step deterministic
inference approach that inpaints color checkers reflecting scene illumination,
(2) a Laplacian decomposition technique that preserves checker structure while
allowing illumination-dependent color adaptation, and (3) a mask-based data
augmentation strategy for handling imprecise color checker annotations. GCC
demonstrates superior robustness in cross-camera scenarios, achieving
state-of-the-art worst-25% error rates of 5.15{\deg} and 4.32{\deg} in
bi-directional evaluations. These results highlight our method's stability and
generalization capability across different camera characteristics without
requiring sensor-specific training, making it a versatile solution for
real-world applications.Summary
AI-Generated Summary