Guess Garantito: Un Approccio di Modellazione Linguistica per la Traspilazione da CISC a RISC con Garanzie di Test
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees
June 17, 2025
Autori: Ahmed Heakl, Sarim Hashmi, Chaimaa Abi, Celine Lee, Abdulrahman Mahmoud
cs.AI
Abstract
L'ecosistema hardware sta evolvendo rapidamente, con un crescente interesse nel tradurre programmi a basso livello tra diverse architetture di set di istruzioni (ISA) in modo rapido, flessibile e corretto, per migliorare la portabilità e la longevità del codice esistente. Una classe particolarmente impegnativa di questo problema di transpilazione è la traduzione tra architetture hardware complesse (CISC) e ridotte (RISC), a causa delle differenze fondamentali nella complessità delle istruzioni, nei modelli di memoria e nei paradigmi di esecuzione. In questo lavoro, introduciamo GG (Guaranteed Guess), una pipeline di transpilazione centrata sull'ISA che combina la potenza di traduzione dei modelli linguistici pre-addestrati su larga scala (LLM) con il rigore dei costrutti consolidati di testing software. Il nostro metodo genera traduzioni candidate utilizzando un LLM da un'ISA a un'altra e incorpora tali traduzioni all'interno di un framework di testing software per costruire una fiducia quantificabile nella traduzione. Valutiamo il nostro approccio GG su due dataset diversi, imponendo un'elevata copertura del codice (>98%) nei test unitari e raggiungendo una correttezza funzionale/semantica del 99% sui programmi HumanEval e del 49% sui programmi BringupBench, rispettivamente. Inoltre, confrontiamo il nostro approccio con il framework all'avanguardia Rosetta 2 su Apple Silicon, dimostrando una performance di runtime 1,73 volte più veloce, un'efficienza energetica 1,47 volte migliore e un utilizzo della memoria 2,41 volte migliore per il nostro codice transpilato, evidenziando l'efficacia di GG per compiti di traduzione CISC-to-RISC nel mondo reale. Renderemo open-source i nostri codici, dati, modelli e benchmark per stabilire una base comune per la ricerca sulla traduzione di codice a livello di ISA.
English
The hardware ecosystem is rapidly evolving, with increasing interest in
translating low-level programs across different instruction set architectures
(ISAs) in a quick, flexible, and correct way to enhance the portability and
longevity of existing code. A particularly challenging class of this
transpilation problem is translating between complex- (CISC) and reduced-
(RISC) hardware architectures, due to fundamental differences in instruction
complexity, memory models, and execution paradigms. In this work, we introduce
GG (Guaranteed Guess), an ISA-centric transpilation pipeline that combines the
translation power of pre-trained large language models (LLMs) with the rigor of
established software testing constructs. Our method generates candidate
translations using an LLM from one ISA to another, and embeds such translations
within a software-testing framework to build quantifiable confidence in the
translation. We evaluate our GG approach over two diverse datasets, enforce
high code coverage (>98%) across unit tests, and achieve functional/semantic
correctness of 99% on HumanEval programs and 49% on BringupBench programs,
respectively. Further, we compare our approach to the state-of-the-art Rosetta
2 framework on Apple Silicon, showcasing 1.73x faster runtime performance,
1.47x better energy efficiency, and 2.41x better memory usage for our
transpiled code, demonstrating the effectiveness of GG for real-world
CISC-to-RISC translation tasks. We will open-source our codes, data, models,
and benchmarks to establish a common foundation for ISA-level code translation
research.