ChatPaper.aiChatPaper

Représentations Neuronales Implicites avec Réseaux de Fourier Kolmogorov-Arnold

Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks

September 14, 2024
Auteurs: Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari, Ilker Hacihaliloglu
cs.AI

Résumé

Les représentations neuronales implicites (RNI) utilisent des réseaux neuronaux pour fournir des représentations continues et indépendantes de la résolution de signaux complexes avec un petit nombre de paramètres. Cependant, les modèles RNI existants échouent souvent à capturer des composantes fréquentielles importantes spécifiques à chaque tâche. Pour résoudre ce problème, dans cet article, nous proposons un réseau Fourier Kolmogorov Arnold (FKAN) pour les RNI. Le FKAN proposé utilise des fonctions d'activation apprenables modélisées sous forme de séries de Fourier dans la première couche pour contrôler et apprendre efficacement les composantes fréquentielles spécifiques à la tâche. De plus, les fonctions d'activation avec des coefficients de Fourier apprenables améliorent la capacité du réseau à capturer des motifs et des détails complexes, ce qui est bénéfique pour les données haute résolution et de haute dimension. Les résultats expérimentaux montrent que notre modèle FKAN proposé surpasse trois schémas de base de pointe et améliore le rapport signal sur bruit maximal (PSNR) et l'indice de similarité structurale (SSIM) pour la tâche de représentation d'images et l'intersection sur l'union (IoU) pour la tâche de représentation de volume d'occupation en 3D, respectivement.
English
Implicit neural representations (INRs) use neural networks to provide continuous and resolution-independent representations of complex signals with a small number of parameters. However, existing INR models often fail to capture important frequency components specific to each task. To address this issue, in this paper, we propose a Fourier Kolmogorov Arnold network (FKAN) for INRs. The proposed FKAN utilizes learnable activation functions modeled as Fourier series in the first layer to effectively control and learn the task-specific frequency components. In addition, the activation functions with learnable Fourier coefficients improve the ability of the network to capture complex patterns and details, which is beneficial for high-resolution and high-dimensional data. Experimental results show that our proposed FKAN model outperforms three state-of-the-art baseline schemes, and improves the peak signal-to-noise ratio (PSNR) and structural similarity index measure (SSIM) for the image representation task and intersection over union (IoU) for the 3D occupancy volume representation task, respectively.

Summary

AI-Generated Summary

PDF52November 16, 2024