Representações Neurais Implícitas com Redes de Fourier Kolmogorov-Arnold
Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks
September 14, 2024
Autores: Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari, Ilker Hacihaliloglu
cs.AI
Resumo
Representações neurais implícitas (INRs) utilizam redes neurais para fornecer representações contínuas e independentes de resolução de sinais complexos com um pequeno número de parâmetros. No entanto, os modelos INR existentes frequentemente falham em capturar componentes de frequência importantes específicos para cada tarefa. Para abordar essa questão, neste artigo, propomos uma rede Fourier Kolmogorov Arnold (FKAN) para INRs. O FKAN proposto utiliza funções de ativação aprendíveis modeladas como séries de Fourier na primeira camada para controlar e aprender de forma eficaz os componentes de frequência específicos da tarefa. Além disso, as funções de ativação com coeficientes de Fourier aprendíveis melhoram a capacidade da rede em capturar padrões e detalhes complexos, o que é benéfico para dados de alta resolução e alta dimensão. Resultados experimentais mostram que nosso modelo FKAN proposto supera três esquemas de referência de última geração e melhora o pico de relação sinal-ruído (PSNR) e a medida de índice de similaridade estrutural (SSIM) para a tarefa de representação de imagem e a interseção sobre a união (IoU) para a tarefa de representação de volume de ocupação 3D, respectivamente.
English
Implicit neural representations (INRs) use neural networks to provide
continuous and resolution-independent representations of complex signals with a
small number of parameters. However, existing INR models often fail to capture
important frequency components specific to each task. To address this issue, in
this paper, we propose a Fourier Kolmogorov Arnold network (FKAN) for INRs. The
proposed FKAN utilizes learnable activation functions modeled as Fourier series
in the first layer to effectively control and learn the task-specific frequency
components. In addition, the activation functions with learnable Fourier
coefficients improve the ability of the network to capture complex patterns and
details, which is beneficial for high-resolution and high-dimensional data.
Experimental results show that our proposed FKAN model outperforms three
state-of-the-art baseline schemes, and improves the peak signal-to-noise ratio
(PSNR) and structural similarity index measure (SSIM) for the image
representation task and intersection over union (IoU) for the 3D occupancy
volume representation task, respectively.Summary
AI-Generated Summary