QUASAR: Generazione di Codice Assembly Quantistico Utilizzando LLM Aumentati da Strumenti tramite RL Agente
QUASAR: Quantum Assembly Code Generation Using Tool-Augmented LLMs via Agentic RL
October 1, 2025
Autori: Cong Yu, Valter Uotila, Shilong Deng, Qingyuan Wu, Tuo Shi, Songlin Jiang, Lei You, Bo Zhao
cs.AI
Abstract
La progettazione e l'ottimizzazione di circuiti quantistici specifici per il compito sono cruciali per sfruttare il vantaggio del calcolo quantistico. Recentemente, la generazione di circuiti quantistici basata su modelli linguistici di grandi dimensioni (LLM) è emersa come una soluzione automatica promettente. Tuttavia, le sfide fondamentali rimangono irrisolte: (i) le porte quantistiche parametrizzate richiedono valori numerici precisi per ottenere prestazioni ottimali, che dipendono anche da molteplici aspetti, tra cui il numero di porte quantistiche, i loro parametri e la struttura/profondità dei circuiti. (ii) Gli LLM spesso generano circuiti quantistici di bassa qualità o errati a causa della mancanza di conoscenze specifiche del dominio quantistico. Proponiamo QUASAR, un framework di apprendimento per rinforzo (RL) agentico per la generazione e l'ottimizzazione di circuiti quantistici basato su LLM potenziati da strumenti. Per allineare l'LLM con conoscenze specifiche del quantum e migliorare i circuiti quantistici generati, QUASAR progetta (i) un approccio di verifica dei circuiti quantistici con simulatori quantistici esterni e (ii) un sofisticato meccanismo di ricompensa gerarchica nell'addestramento RL. Una valutazione estensiva mostra miglioramenti sia nelle prestazioni sintattiche che semantiche dei circuiti quantistici generati. Quando potenzia un LLM da 4B, QUASAR ha raggiunto una validità del 99,31% in Pass@1 e del 100% in Pass@10, superando gli LLM industriali GPT-4o, GPT-5 e DeepSeek-V3 e diverse baseline basate esclusivamente su fine-tuning supervisionato (SFT) o solo RL.
English
Designing and optimizing task-specific quantum circuits are crucial to
leverage the advantage of quantum computing. Recent large language model
(LLM)-based quantum circuit generation has emerged as a promising automatic
solution. However, the fundamental challenges remain unaddressed: (i)
parameterized quantum gates require precise numerical values for optimal
performance, which also depend on multiple aspects, including the number of
quantum gates, their parameters, and the layout/depth of the circuits. (ii)
LLMs often generate low-quality or incorrect quantum circuits due to the lack
of quantum domain-specific knowledge. We propose QUASAR, an agentic
reinforcement learning (RL) framework for quantum circuits generation and
optimization based on tool-augmented LLMs. To align the LLM with
quantum-specific knowledge and improve the generated quantum circuits, QUASAR
designs (i) a quantum circuit verification approach with external quantum
simulators and (ii) a sophisticated hierarchical reward mechanism in RL
training. Extensive evaluation shows improvements in both syntax and semantic
performance of the generated quantum circuits. When augmenting a 4B LLM, QUASAR
has achieved the validity of 99.31% in Pass@1 and 100% in Pass@10,
outperforming industrial LLMs of GPT-4o, GPT-5 and DeepSeek-V3 and several
supervised-fine-tuning (SFT)-only and RL-only baselines.