Gated QKAN-FWP: Schaalbaar quantum-geïnspireerd sequentieel leren
Gated QKAN-FWP: Scalable Quantum-inspired Sequence Learning
May 7, 2026
Auteurs: Kuo-Chung Peng, Samuel Yen-Chi Chen, Jiun-Cheng Jiang, Chen-Yu Liu, En-Jui Kuo, Yun-Yuan Wang, Prayag Tiwari, Andrea Ceschini, Chi-Sheng Chen, Yu-Chao Hsu, Chun-Hua Lin, Tai-Yue Li, Antonello Rosato, Massimo Panella, Simon See, Saif Al-Kuwari, Kuan-Cheng Chen, Nan-Yow Chen, Hsi-Sheng Goan
cs.AI
Samenvatting
Snelle Gewichtsprogrammeurs (FWP's) coderen temporele afhankelijkheden via dynamisch bijgewerkte parameters in plaats van recurrente verborgen toestanden. Kwantum FWP's (QFWP's) breiden dit idee uit met variatiële kwantumcircuits (VQC's), maar bestaande implementaties zijn afhankelijk van multi-qubit-architecturen die moeilijk schaalbaar zijn op ruisige intermediate-scale quantum (NISQ)-apparaten en duur om klassiek te simuleren. Wij stellen gated QKAN-FWP voor, een snelgewichtsraamwerk dat FWP integreert met een Kwantum-geïnspireerd Kolmogorov-Arnold-netwerk (QKAN) via enkel-qubit dataheruploadcircuits als leerbare niet-lineaire activatie, bekend als Data Herupload Activering (DARUAN). Verder introduceren we een scalaar-gate snelle gewichtsupdateregel die parameterevolutie stabiliseert, ondersteund door een theoretische analyse van de adaptieve geheugenkern, geometrische begrensdheid en paralleliseerbare gradiëntpaden. We evalueren het raamwerk op tijdreeksbenchmarks, MiniGrid-versterkingsleren en benadrukken realistische zonnecyclusvoorspelling als ons belangrijkste praktische resultaat. In de lange-horizoninstelling met een invoervenster van 528 maanden en een voorspellingshorizon van 132 maanden behaalt ons model met 12,5k parameters lagere geschaalde gemiddelde kwadratische fout (MSE), piekamplitudefout en piektijdfout dan een reeks klassieke recurrente basislijnen met tot 13x meer parameters, waaronder Long Short-Term Memory (LSTM)-netwerken (25,9k-89,1k parameters), WaveNet-LSTM (167k), Vanilla recurrent neuraal netwerk (11,5k) en een Gewijzigd Echo State Network (132k). Om NISQ-compatibiliteit te valideren, implementeren we de getrainde snelle programmeur verder op IonQ- en IBM Quantum-processoren, waarbij we een voorspellingsnauwkeurigheid binnen 0,1% relatieve MSE van de ruisvrije simulator herwinnen bij 1024 shots. Deze resultaten positioneren gated QKAN-FWP als een schaalbare, parameter-efficiënte en NISQ-compatibele benadering van kwantum-geïnspireerd sequentiemodelleren.
English
Fast Weight Programmers (FWPs) encode temporal dependencies through dynamically updated parameters rather than recurrent hidden states. Quantum FWPs (QFWPs) extend this idea with variational quantum circuits (VQCs), but existing implementations rely on multi-qubit architectures that are difficult to scale on noisy intermediate-scale quantum (NISQ) devices and expensive to simulate classically. We propose gated QKAN-FWP, a fast-weight framework that integrates FWP with Quantum-inspired Kolmogorov-Arnold Network (QKAN) using single-qubit data re-uploading circuits as learnable nonlinear activation, known as DatA Re-Uploading ActivatioN (DARUAN). We further introduce a scalar-gated fast-weight update rule that stabilizes parameter evolution, supported by a theoretical analysis of its adaptive memory kernel, geometric boundedness, and parallelizable gradient paths. We evaluate the framework across time-series benchmarks, MiniGrid reinforcement learning, and highlight real-world solar cycle forecasting as our main practical result. In the long-horizon setting with 528-month input window and 132-month forecast horizon, our 12.5k-parameter model achieves lower scaled Mean Square Error (MSE), peak amplitude error, and peak timing error than a suite of classical recurrent baselines with up to 13x more parameters, including Long Short-Term Memory (LSTM) networks (25.9k-89.1k parameters), WaveNet-LSTM (167k), Vanilla recurrent neural network (11.5k), and a Modified Echo State Network (132k). To validate NISQ compatibility, we further deploy the trained fast programmer on IonQ and IBM Quantum processors, recovering forecasting accuracy within 0.1% relative MSE of the noiseless simulator at 1024 shots. These results position gated QKAN-FWP as a scalable, parameter-efficient, and NISQ-compatible approach to quantum-inspired sequence modeling.