ChatPaper.aiChatPaper

GCC: Generative Farbkonstanz durch Diffusion eines Farbprüfcharts

GCC: Generative Color Constancy via Diffusing a Color Checker

February 24, 2025
Autoren: Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang, Yi-Chen Lo, Yu-Chee Tseng, Jiun-Long Huang, Yu-Lun Liu
cs.AI

Zusammenfassung

Methoden zur Farbkonstanz haben oft Schwierigkeiten, sich über verschiedene Kamerasensoren hinweg zu verallgemeinern, was auf unterschiedliche spektrale Empfindlichkeiten zurückzuführen ist. Wir präsentieren GCC, das Diffusionsmodelle nutzt, um Farbprüfkarten in Bilder einzufügen und so die Beleuchtung zu schätzen. Unsere wesentlichen Innovationen umfassen (1) einen einstufigen deterministischen Inferenzansatz, der Farbprüfkarten einfügt, die die Beleuchtung der Szene widerspiegeln, (2) eine Laplace-Zerlegungstechnik, die die Struktur der Prüfkarten bewahrt, während eine beleuchtungsabhängige Farbanpassung ermöglicht wird, und (3) eine maskenbasierte Datenaugmentationsstrategie zur Handhabung ungenauer Annotationen von Farbprüfkarten. GCC zeigt eine überlegene Robustheit in Szenarien mit verschiedenen Kameras und erreicht state-of-the-art Fehlerraten der schlechtesten 25 % von 5,15° und 4,32° in bidirektionalen Bewertungen. Diese Ergebnisse unterstreichen die Stabilität und Generalisierungsfähigkeit unserer Methode über verschiedene Kameracharakteristiken hinweg, ohne dass eine sensorspezifische Trainingsphase erforderlich ist, was sie zu einer vielseitigen Lösung für reale Anwendungen macht.
English
Color constancy methods often struggle to generalize across different camera sensors due to varying spectral sensitivities. We present GCC, which leverages diffusion models to inpaint color checkers into images for illumination estimation. Our key innovations include (1) a single-step deterministic inference approach that inpaints color checkers reflecting scene illumination, (2) a Laplacian decomposition technique that preserves checker structure while allowing illumination-dependent color adaptation, and (3) a mask-based data augmentation strategy for handling imprecise color checker annotations. GCC demonstrates superior robustness in cross-camera scenarios, achieving state-of-the-art worst-25% error rates of 5.15{\deg} and 4.32{\deg} in bi-directional evaluations. These results highlight our method's stability and generalization capability across different camera characteristics without requiring sensor-specific training, making it a versatile solution for real-world applications.

Summary

AI-Generated Summary

PDF282February 25, 2025