ChatPaper.aiChatPaper

Propagazione delle Caratteristiche Ispirata a Kalman per la Super-Risoluzione di Volti in Video

Kalman-Inspired Feature Propagation for Video Face Super-Resolution

August 9, 2024
Autori: Ruicheng Feng, Chongyi Li, Chen Change Loy
cs.AI

Abstract

Nonostante i promettenti progressi nel super-risoluzione delle immagini di volti, il super-risoluzione video di volti rimane relativamente poco esplorato. Gli approcci esistenti adattano reti di super-risoluzione video generiche a dataset di volti o applicano modelli consolidati di super-risoluzione di immagini di volti in modo indipendente sui singoli fotogrammi video. Questi paradigmi incontrano sfide sia nella ricostruzione dei dettagli facciali che nel mantenimento della coerenza temporale. Per affrontare questi problemi, introduciamo un nuovo framework chiamato Kalman-inspired Feature Propagation (KEEP), progettato per mantenere una priorità stabile del volto nel tempo. I principi del filtraggio di Kalman offrono al nostro metodo una capacità ricorrente di utilizzare le informazioni dai fotogrammi precedentemente ripristinati per guidare e regolare il processo di ripristino del fotogramma corrente. Esperimenti estensivi dimostrano l'efficacia del nostro metodo nel catturare i dettagli facciali in modo coerente attraverso i fotogrammi video. Il codice e una demo video sono disponibili all'indirizzo https://jnjaby.github.io/projects/KEEP.
English
Despite the promising progress of face image super-resolution, video face super-resolution remains relatively under-explored. Existing approaches either adapt general video super-resolution networks to face datasets or apply established face image super-resolution models independently on individual video frames. These paradigms encounter challenges either in reconstructing facial details or maintaining temporal consistency. To address these issues, we introduce a novel framework called Kalman-inspired Feature Propagation (KEEP), designed to maintain a stable face prior over time. The Kalman filtering principles offer our method a recurrent ability to use the information from previously restored frames to guide and regulate the restoration process of the current frame. Extensive experiments demonstrate the effectiveness of our method in capturing facial details consistently across video frames. Code and video demo are available at https://jnjaby.github.io/projects/KEEP.
PDF103November 28, 2024