Два в одном: Дуэт периодичности и направленности для устранения мерцания
It Takes Two: A Duet of Periodicity and Directionality for Burst Flicker Removal
March 24, 2026
Авторы: Lishen Qu, Shihao Zhou, Jie Liang, Hui Zeng, Lei Zhang, Jufeng Yang
cs.AI
Аннотация
Артефакты мерцания, возникающие из-за нестабильного освещения и построчных несоответствий экспозиции, представляют значительную проблему в фотографии с короткой выдержкой, существенно ухудшая качество изображения. В отличие от типичных артефактов, таких как шум или недостаточная освещенность, мерцание представляет собой структурированную деградацию со специфическими пространственно-временными паттернами, которые не учитываются в современных универсальных фреймворках восстановления, что приводит к неоптимальному подавлению мерцания и появлению артефактов ореолов (госсинга). В данной работе мы показываем, что артефакты мерцания обладают двумя внутренними характеристиками — периодичностью и направленностью, — и предлагаем Flickerformer, архитектуру на основе трансформеров, которая эффективно устраняет мерцание без введения артефактов ореолов. В частности, Flickerformer включает три ключевых компонента: модуль фазового слияния (PFM), автокорреляционную прямую сеть (AFFN) и модуль направленного внимания на основе вейвлетов (WDAM). Основываясь на периодичности, PFM выполняет межкадровую фазовую корреляцию для адаптивного агрегирования признаков из серии кадров (burst), в то время как AFFN использует внутрикадровые структурные закономерности через автокорреляцию, совместно усиливая способность сети воспринимать пространственно повторяющиеся паттерны. Кроме того, руководствуясь направленностью артефактов мерцания, WDAM использует высокочастотные вариации в вейвлет-области для управления восстановлением низкочастотных темных областей, обеспечивая точную локализацию артефактов мерцания. Многочисленные эксперименты демонстрируют, что Flickerformer превосходит современные подходы как по количественным метрикам, так и по визуальному качеству. Исходный код доступен по адресу https://github.com/qulishen/Flickerformer.
English
Flicker artifacts, arising from unstable illumination and row-wise exposure inconsistencies, pose a significant challenge in short-exposure photography, severely degrading image quality. Unlike typical artifacts, e.g., noise and low-light, flicker is a structured degradation with specific spatial-temporal patterns, which are not accounted for in current generic restoration frameworks, leading to suboptimal flicker suppression and ghosting artifacts. In this work, we reveal that flicker artifacts exhibit two intrinsic characteristics, periodicity and directionality, and propose Flickerformer, a transformer-based architecture that effectively removes flicker without introducing ghosting. Specifically, Flickerformer comprises three key components: a phase-based fusion module (PFM), an autocorrelation feed-forward network (AFFN), and a wavelet-based directional attention module (WDAM). Based on the periodicity, PFM performs inter-frame phase correlation to adaptively aggregate burst features, while AFFN exploits intra-frame structural regularities through autocorrelation, jointly enhancing the network's ability to perceive spatially recurring patterns. Moreover, motivated by the directionality of flicker artifacts, WDAM leverages high-frequency variations in the wavelet domain to guide the restoration of low-frequency dark regions, yielding precise localization of flicker artifacts. Extensive experiments demonstrate that Flickerformer outperforms state-of-the-art approaches in both quantitative metrics and visual quality. The source code is available at https://github.com/qulishen/Flickerformer.