Representaciones Neurales Implícitas con Redes de Fourier Kolmogorov-Arnold.
Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks
September 14, 2024
Autores: Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari, Ilker Hacihaliloglu
cs.AI
Resumen
Las representaciones neuronales implícitas (INRs) utilizan redes neuronales para proporcionar representaciones continuas e independientes de la resolución de señales complejas con un número reducido de parámetros. Sin embargo, los modelos INR existentes a menudo no logran capturar componentes de frecuencia importantes específicos para cada tarea. Para abordar este problema, en este documento proponemos una red de Fourier Kolmogorov Arnold (FKAN) para INRs. El FKAN propuesto utiliza funciones de activación aprendibles modeladas como series de Fourier en la primera capa para controlar y aprender de manera efectiva los componentes de frecuencia específicos de la tarea. Además, las funciones de activación con coeficientes de Fourier aprendibles mejoran la capacidad de la red para capturar patrones y detalles complejos, lo cual es beneficioso para datos de alta resolución y alta dimensionalidad. Los resultados experimentales muestran que nuestro modelo FKAN propuesto supera a tres esquemas de referencia de última generación y mejora el índice de relación señal a ruido pico (PSNR) y la medida de índice de similitud estructural (SSIM) para la tarea de representación de imágenes y la intersección sobre unión (IoU) para la tarea de representación de volumen de ocupación 3D, respectivamente.
English
Implicit neural representations (INRs) use neural networks to provide
continuous and resolution-independent representations of complex signals with a
small number of parameters. However, existing INR models often fail to capture
important frequency components specific to each task. To address this issue, in
this paper, we propose a Fourier Kolmogorov Arnold network (FKAN) for INRs. The
proposed FKAN utilizes learnable activation functions modeled as Fourier series
in the first layer to effectively control and learn the task-specific frequency
components. In addition, the activation functions with learnable Fourier
coefficients improve the ability of the network to capture complex patterns and
details, which is beneficial for high-resolution and high-dimensional data.
Experimental results show that our proposed FKAN model outperforms three
state-of-the-art baseline schemes, and improves the peak signal-to-noise ratio
(PSNR) and structural similarity index measure (SSIM) for the image
representation task and intersection over union (IoU) for the 3D occupancy
volume representation task, respectively.Summary
AI-Generated Summary