Garantierte Vermutung: Ein Sprachmodellierungsansatz für die CISC-zu-RISC-Transpilation mit Testgarantien
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees
June 17, 2025
Autoren: Ahmed Heakl, Sarim Hashmi, Chaimaa Abi, Celine Lee, Abdulrahman Mahmoud
cs.AI
Zusammenfassung
Die Hardware-Ökosysteme entwickeln sich rasant, wobei das Interesse an der Übersetzung von Low-Level-Programmen zwischen verschiedenen Befehlssatzarchitekturen (ISAs) auf schnelle, flexible und korrekte Weise zunimmt, um die Portabilität und Langlebigkeit bestehender Codes zu verbessern. Eine besonders anspruchsvolle Klasse dieses Transpilationsproblems ist die Übersetzung zwischen komplexen (CISC) und reduzierten (RISC) Hardware-Architekturen, bedingt durch grundlegende Unterschiede in der Befehlskomplexität, Speichermodellen und Ausführungsparadigmen. In dieser Arbeit stellen wir GG (Guaranteed Guess) vor, eine ISA-zentrierte Transpilationspipeline, die die Übersetzungsleistung von vortrainierten großen Sprachmodellen (LLMs) mit der Strenge etablierter Software-Testkonstrukte kombiniert. Unser Ansatz generiert Kandidatenübersetzungen mithilfe eines LLMs von einer ISA zu einer anderen und bettet diese Übersetzungen in einen Software-Testrahmen ein, um ein quantifizierbares Vertrauen in die Übersetzung aufzubauen. Wir evaluieren unseren GG-Ansatz anhand von zwei diversen Datensätzen, erreichen eine hohe Code-Abdeckung (>98 %) in Unit-Tests und erzielen eine funktionale/semantische Korrektheit von 99 % bei HumanEval-Programmen und 49 % bei BringupBench-Programmen. Darüber hinaus vergleichen wir unseren Ansatz mit dem state-of-the-art Rosetta 2-Framework auf Apple Silicon und zeigen eine 1,73x schnellere Laufzeitleistung, eine 1,47x bessere Energieeffizienz und eine 2,41x bessere Speichernutzung für unseren transpilierten Code, was die Effektivität von GG für reale CISC-zu-RISC-Übersetzungsaufgaben demonstriert. Wir werden unsere Codes, Daten, Modelle und Benchmarks open-source bereitstellen, um eine gemeinsame Grundlage für die Forschung zur ISA-Ebene-Code-Übersetzung zu schaffen.
English
The hardware ecosystem is rapidly evolving, with increasing interest in
translating low-level programs across different instruction set architectures
(ISAs) in a quick, flexible, and correct way to enhance the portability and
longevity of existing code. A particularly challenging class of this
transpilation problem is translating between complex- (CISC) and reduced-
(RISC) hardware architectures, due to fundamental differences in instruction
complexity, memory models, and execution paradigms. In this work, we introduce
GG (Guaranteed Guess), an ISA-centric transpilation pipeline that combines the
translation power of pre-trained large language models (LLMs) with the rigor of
established software testing constructs. Our method generates candidate
translations using an LLM from one ISA to another, and embeds such translations
within a software-testing framework to build quantifiable confidence in the
translation. We evaluate our GG approach over two diverse datasets, enforce
high code coverage (>98%) across unit tests, and achieve functional/semantic
correctness of 99% on HumanEval programs and 49% on BringupBench programs,
respectively. Further, we compare our approach to the state-of-the-art Rosetta
2 framework on Apple Silicon, showcasing 1.73x faster runtime performance,
1.47x better energy efficiency, and 2.41x better memory usage for our
transpiled code, demonstrating the effectiveness of GG for real-world
CISC-to-RISC translation tasks. We will open-source our codes, data, models,
and benchmarks to establish a common foundation for ISA-level code translation
research.