Représentations Neuronales Implicites avec Réseaux de Fourier Kolmogorov-Arnold
Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks
September 14, 2024
Auteurs: Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari, Ilker Hacihaliloglu
cs.AI
Résumé
Les représentations neuronales implicites (RNI) utilisent des réseaux neuronaux pour fournir des représentations continues et indépendantes de la résolution de signaux complexes avec un petit nombre de paramètres. Cependant, les modèles RNI existants échouent souvent à capturer des composantes fréquentielles importantes spécifiques à chaque tâche. Pour résoudre ce problème, dans cet article, nous proposons un réseau Fourier Kolmogorov Arnold (FKAN) pour les RNI. Le FKAN proposé utilise des fonctions d'activation apprenables modélisées sous forme de séries de Fourier dans la première couche pour contrôler et apprendre efficacement les composantes fréquentielles spécifiques à la tâche. De plus, les fonctions d'activation avec des coefficients de Fourier apprenables améliorent la capacité du réseau à capturer des motifs et des détails complexes, ce qui est bénéfique pour les données haute résolution et de haute dimension. Les résultats expérimentaux montrent que notre modèle FKAN proposé surpasse trois schémas de base de pointe et améliore le rapport signal sur bruit maximal (PSNR) et l'indice de similarité structurale (SSIM) pour la tâche de représentation d'images et l'intersection sur l'union (IoU) pour la tâche de représentation de volume d'occupation en 3D, respectivement.
English
Implicit neural representations (INRs) use neural networks to provide
continuous and resolution-independent representations of complex signals with a
small number of parameters. However, existing INR models often fail to capture
important frequency components specific to each task. To address this issue, in
this paper, we propose a Fourier Kolmogorov Arnold network (FKAN) for INRs. The
proposed FKAN utilizes learnable activation functions modeled as Fourier series
in the first layer to effectively control and learn the task-specific frequency
components. In addition, the activation functions with learnable Fourier
coefficients improve the ability of the network to capture complex patterns and
details, which is beneficial for high-resolution and high-dimensional data.
Experimental results show that our proposed FKAN model outperforms three
state-of-the-art baseline schemes, and improves the peak signal-to-noise ratio
(PSNR) and structural similarity index measure (SSIM) for the image
representation task and intersection over union (IoU) for the 3D occupancy
volume representation task, respectively.Summary
AI-Generated Summary