Devination Garantie : Une Approche de Modélisation du Langage pour la Transpilation CISC-vers-RISC avec Garanties de Test
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees
June 17, 2025
Auteurs: Ahmed Heakl, Sarim Hashmi, Chaimaa Abi, Celine Lee, Abdulrahman Mahmoud
cs.AI
Résumé
L'écosystème matériel évolue rapidement, avec un intérêt croissant pour la traduction de programmes de bas niveau entre différentes architectures de jeu d'instructions (ISAs) de manière rapide, flexible et correcte, afin d'améliorer la portabilité et la longévité du code existant. Une classe particulièrement complexe de ce problème de transpilation est la traduction entre architectures matérielles complexes (CISC) et réduites (RISC), en raison des différences fondamentales dans la complexité des instructions, les modèles de mémoire et les paradigmes d'exécution. Dans ce travail, nous présentons GG (Guaranteed Guess), un pipeline de transpilation centré sur les ISAs qui combine la puissance de traduction des grands modèles de langage pré-entraînés (LLMs) avec la rigueur des constructions établies de tests logiciels. Notre méthode génère des traductions candidates à l'aide d'un LLM d'une ISA à une autre, et intègre ces traductions dans un cadre de tests logiciels pour établir une confiance quantifiable dans la traduction. Nous évaluons notre approche GG sur deux ensembles de données diversifiés, imposons une couverture de code élevée (>98%) à travers les tests unitaires, et atteignons une exactitude fonctionnelle/sémantique de 99% sur les programmes HumanEval et de 49% sur les programmes BringupBench, respectivement. De plus, nous comparons notre approche au framework Rosetta 2 de pointe sur Apple Silicon, démontrant une performance d'exécution 1,73x plus rapide, une efficacité énergétique 1,47x meilleure et une utilisation de mémoire 2,41x plus efficace pour notre code transpilé, illustrant ainsi l'efficacité de GG pour les tâches de traduction CISC-vers-RISC en conditions réelles. Nous rendrons publics nos codes, données, modèles et benchmarks pour établir une base commune pour la recherche sur la traduction de code au niveau des ISAs.
English
The hardware ecosystem is rapidly evolving, with increasing interest in
translating low-level programs across different instruction set architectures
(ISAs) in a quick, flexible, and correct way to enhance the portability and
longevity of existing code. A particularly challenging class of this
transpilation problem is translating between complex- (CISC) and reduced-
(RISC) hardware architectures, due to fundamental differences in instruction
complexity, memory models, and execution paradigms. In this work, we introduce
GG (Guaranteed Guess), an ISA-centric transpilation pipeline that combines the
translation power of pre-trained large language models (LLMs) with the rigor of
established software testing constructs. Our method generates candidate
translations using an LLM from one ISA to another, and embeds such translations
within a software-testing framework to build quantifiable confidence in the
translation. We evaluate our GG approach over two diverse datasets, enforce
high code coverage (>98%) across unit tests, and achieve functional/semantic
correctness of 99% on HumanEval programs and 49% on BringupBench programs,
respectively. Further, we compare our approach to the state-of-the-art Rosetta
2 framework on Apple Silicon, showcasing 1.73x faster runtime performance,
1.47x better energy efficiency, and 2.41x better memory usage for our
transpiled code, demonstrating the effectiveness of GG for real-world
CISC-to-RISC translation tasks. We will open-source our codes, data, models,
and benchmarks to establish a common foundation for ISA-level code translation
research.