Débruitage cohérent de la profondeur par temps de vol via une attention géométrique informée par graphe

papers.abstract

Les images de profondeur capturées par les capteurs Time-of-Flight (ToF) sont sujettes au bruit, nécessitant un débruitage pour des applications fiables en aval. Les travaux précédents se concentrent soit sur le traitement d'une seule image, soit effectuent un traitement multi-images sans tenir compte des variations de profondeur aux pixels correspondants entre les images, ce qui entraîne une incohérence temporelle et une ambiguïté spatiale indésirables. Dans cet article, nous proposons un nouveau réseau de débruitage de profondeur ToF exploitant la fusion de graphes invariants au mouvement pour améliorer simultanément la stabilité temporelle et la netteté spatiale. Plus précisément, malgré les décalages de profondeur entre les images, les structures de graphes présentent une auto-similarité temporelle, permettant une attention géométrique inter-images pour la fusion de graphes. Ensuite, en incorporant un a priori de lissage d'image sur le graphe fusionné et un terme de fidélité aux données dérivé de la distribution du bruit ToF, nous formulons un problème d'estimation a posteriori maximale pour le débruitage ToF. Enfin, la solution est dépliée en filtres itératifs dont les poids sont appris de manière adaptative à partir de l'attention géométrique informée par le graphe, produisant un réseau à la fois performant et interprétable. Les résultats expérimentaux démontrent que le schéma proposé atteint des performances de pointe en termes de précision et de cohérence sur le jeu de données synthétique DVToF et présente une généralisation robuste sur le jeu de données réel Kinectv2. Le code source sera disponible à l'adresse suivante : https://github.com/davidweidawang/GIGA-ToF{https://github.com/davidweidawang/GIGA-ToF}.

English

Depth images captured by Time-of-Flight (ToF) sensors are prone to noise, requiring denoising for reliable downstream applications. Previous works either focus on single-frame processing, or perform multi-frame processing without considering depth variations at corresponding pixels across frames, leading to undesirable temporal inconsistency and spatial ambiguity. In this paper, we propose a novel ToF depth denoising network leveraging motion-invariant graph fusion to simultaneously enhance temporal stability and spatial sharpness. Specifically, despite depth shifts across frames, graph structures exhibit temporal self-similarity, enabling cross-frame geometric attention for graph fusion. Then, by incorporating an image smoothness prior on the fused graph and data fidelity term derived from ToF noise distribution, we formulate a maximum a posterior problem for ToF denoising. Finally, the solution is unrolled into iterative filters whose weights are adaptively learned from the graph-informed geometric attention, producing a high-performance yet interpretable network. Experimental results demonstrate that the proposed scheme achieves state-of-the-art performance in terms of accuracy and consistency on synthetic DVToF dataset and exhibits robust generalization on the real Kinectv2 dataset. Source code will be released at https://github.com/davidweidawang/GIGA-ToF{https://github.com/davidweidawang/GIGA-ToF}.

Débruitage cohérent de la profondeur par temps de vol via une attention géométrique informée par graphe

Consistent Time-of-Flight Depth Denoising via Graph-Informed Geometric Attention

papers.abstract

Support