ChatPaper.aiChatPaper

Impliciete neurale representaties met Fourier Kolmogorov-Arnold netwerken.

Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks

September 14, 2024
Auteurs: Ali Mehrabian, Parsa Mojarad Adi, Moein Heidari, Ilker Hacihaliloglu
cs.AI

Samenvatting

Impliciete neurale representaties (INR's) maken gebruik van neurale netwerken om continue en resolutie-onafhankelijke representaties van complexe signalen te bieden met een klein aantal parameters. Bestaande INR-modellen slagen er echter vaak niet in om belangrijke frequentiecomponenten vast te leggen die specifiek zijn voor elke taak. Om dit probleem aan te pakken, stellen we in dit artikel een Fourier Kolmogorov Arnold-netwerk (FKAN) voor INR's voor. Het voorgestelde FKAN maakt gebruik van aanpasbare activatiefuncties gemodelleerd als Fourierreeksen in de eerste laag om effectief de taakspecifieke frequentiecomponenten te regelen en te leren. Bovendien verbeteren de activatiefuncties met aanpasbare Fourier-coëfficiënten het vermogen van het netwerk om complexe patronen en details vast te leggen, wat gunstig is voor data met een hoge resolutie en hoge dimensies. Experimentele resultaten tonen aan dat ons voorgestelde FKAN-model drie toonaangevende basisschema's overtreft en de piek-signaal-ruisverhouding (PSNR) en structurele gelijkenisindexmaat (SSIM) verbetert voor de beeldrepresentatietaak en intersection over union (IoU) voor de 3D-bezettingsvolumerepresentatietaak, respectievelijk.
English
Implicit neural representations (INRs) use neural networks to provide continuous and resolution-independent representations of complex signals with a small number of parameters. However, existing INR models often fail to capture important frequency components specific to each task. To address this issue, in this paper, we propose a Fourier Kolmogorov Arnold network (FKAN) for INRs. The proposed FKAN utilizes learnable activation functions modeled as Fourier series in the first layer to effectively control and learn the task-specific frequency components. In addition, the activation functions with learnable Fourier coefficients improve the ability of the network to capture complex patterns and details, which is beneficial for high-resolution and high-dimensional data. Experimental results show that our proposed FKAN model outperforms three state-of-the-art baseline schemes, and improves the peak signal-to-noise ratio (PSNR) and structural similarity index measure (SSIM) for the image representation task and intersection over union (IoU) for the 3D occupancy volume representation task, respectively.

Summary

AI-Generated Summary

PDF52November 16, 2024