QUASAR: Generazione di Codice Assembly Quantistico Utilizzando LLM Aumentati da Strumenti tramite RL Agente

Abstract

La progettazione e l'ottimizzazione di circuiti quantistici specifici per il compito sono cruciali per sfruttare il vantaggio del calcolo quantistico. Recentemente, la generazione di circuiti quantistici basata su modelli linguistici di grandi dimensioni (LLM) è emersa come una soluzione automatica promettente. Tuttavia, le sfide fondamentali rimangono irrisolte: (i) le porte quantistiche parametrizzate richiedono valori numerici precisi per ottenere prestazioni ottimali, che dipendono anche da molteplici aspetti, tra cui il numero di porte quantistiche, i loro parametri e la struttura/profondità dei circuiti. (ii) Gli LLM spesso generano circuiti quantistici di bassa qualità o errati a causa della mancanza di conoscenze specifiche del dominio quantistico. Proponiamo QUASAR, un framework di apprendimento per rinforzo (RL) agentico per la generazione e l'ottimizzazione di circuiti quantistici basato su LLM potenziati da strumenti. Per allineare l'LLM con conoscenze specifiche del quantum e migliorare i circuiti quantistici generati, QUASAR progetta (i) un approccio di verifica dei circuiti quantistici con simulatori quantistici esterni e (ii) un sofisticato meccanismo di ricompensa gerarchica nell'addestramento RL. Una valutazione estensiva mostra miglioramenti sia nelle prestazioni sintattiche che semantiche dei circuiti quantistici generati. Quando potenzia un LLM da 4B, QUASAR ha raggiunto una validità del 99,31% in Pass@1 e del 100% in Pass@10, superando gli LLM industriali GPT-4o, GPT-5 e DeepSeek-V3 e diverse baseline basate esclusivamente su fine-tuning supervisionato (SFT) o solo RL.

English

Designing and optimizing task-specific quantum circuits are crucial to leverage the advantage of quantum computing. Recent large language model (LLM)-based quantum circuit generation has emerged as a promising automatic solution. However, the fundamental challenges remain unaddressed: (i) parameterized quantum gates require precise numerical values for optimal performance, which also depend on multiple aspects, including the number of quantum gates, their parameters, and the layout/depth of the circuits. (ii) LLMs often generate low-quality or incorrect quantum circuits due to the lack of quantum domain-specific knowledge. We propose QUASAR, an agentic reinforcement learning (RL) framework for quantum circuits generation and optimization based on tool-augmented LLMs. To align the LLM with quantum-specific knowledge and improve the generated quantum circuits, QUASAR designs (i) a quantum circuit verification approach with external quantum simulators and (ii) a sophisticated hierarchical reward mechanism in RL training. Extensive evaluation shows improvements in both syntax and semantic performance of the generated quantum circuits. When augmenting a 4B LLM, QUASAR has achieved the validity of 99.31% in Pass@1 and 100% in Pass@10, outperforming industrial LLMs of GPT-4o, GPT-5 and DeepSeek-V3 and several supervised-fine-tuning (SFT)-only and RL-only baselines.

QUASAR: Generazione di Codice Assembly Quantistico Utilizzando LLM Aumentati da Strumenti tramite RL Agente

QUASAR: Quantum Assembly Code Generation Using Tool-Augmented LLMs via Agentic RL

Abstract

Support