Adivinación Garantizada: Un Enfoque de Modelado del Lenguaje para la Transpilación de CISC a RISC con Garantías de Pruebas
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees
June 17, 2025
Autores: Ahmed Heakl, Sarim Hashmi, Chaimaa Abi, Celine Lee, Abdulrahman Mahmoud
cs.AI
Resumen
El ecosistema de hardware está evolucionando rápidamente, con un creciente interés en traducir programas de bajo nivel entre diferentes arquitecturas de conjunto de instrucciones (ISA) de manera rápida, flexible y correcta para mejorar la portabilidad y longevidad del código existente. Una clase particularmente desafiante de este problema de transpilación es la traducción entre arquitecturas de hardware complejas (CISC) y reducidas (RISC), debido a diferencias fundamentales en la complejidad de las instrucciones, los modelos de memoria y los paradigmas de ejecución. En este trabajo, presentamos GG (Guaranteed Guess), una canalización de transpilación centrada en ISA que combina el poder de traducción de modelos de lenguaje preentrenados (LLM) con el rigor de constructos establecidos de pruebas de software. Nuestro método genera traducciones candidatas utilizando un LLM de una ISA a otra, e integra dichas traducciones dentro de un marco de pruebas de software para construir una confianza cuantificable en la traducción. Evaluamos nuestro enfoque GG en dos conjuntos de datos diversos, aplicamos una alta cobertura de código (>98%) en pruebas unitarias y logramos una corrección funcional/semántica del 99% en programas HumanEval y del 49% en programas BringupBench, respectivamente. Además, comparamos nuestro enfoque con el marco de referencia Rosetta 2 en Apple Silicon, mostrando un rendimiento en tiempo de ejecución 1.73 veces más rápido, una eficiencia energética 1.47 veces mejor y un uso de memoria 2.41 veces mejor para nuestro código transpilado, demostrando la efectividad de GG para tareas de traducción CISC a RISC en el mundo real. Abriremos el código, los datos, los modelos y los puntos de referencia para establecer una base común en la investigación de traducción de código a nivel de ISA.
English
The hardware ecosystem is rapidly evolving, with increasing interest in
translating low-level programs across different instruction set architectures
(ISAs) in a quick, flexible, and correct way to enhance the portability and
longevity of existing code. A particularly challenging class of this
transpilation problem is translating between complex- (CISC) and reduced-
(RISC) hardware architectures, due to fundamental differences in instruction
complexity, memory models, and execution paradigms. In this work, we introduce
GG (Guaranteed Guess), an ISA-centric transpilation pipeline that combines the
translation power of pre-trained large language models (LLMs) with the rigor of
established software testing constructs. Our method generates candidate
translations using an LLM from one ISA to another, and embeds such translations
within a software-testing framework to build quantifiable confidence in the
translation. We evaluate our GG approach over two diverse datasets, enforce
high code coverage (>98%) across unit tests, and achieve functional/semantic
correctness of 99% on HumanEval programs and 49% on BringupBench programs,
respectively. Further, we compare our approach to the state-of-the-art Rosetta
2 framework on Apple Silicon, showcasing 1.73x faster runtime performance,
1.47x better energy efficiency, and 2.41x better memory usage for our
transpiled code, demonstrating the effectiveness of GG for real-world
CISC-to-RISC translation tasks. We will open-source our codes, data, models,
and benchmarks to establish a common foundation for ISA-level code translation
research.