Гарантированное предположение: подход на основе языкового моделирования для трансляции с CISC на RISC с гарантиями тестирования
Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees
June 17, 2025
Авторы: Ahmed Heakl, Sarim Hashmi, Chaimaa Abi, Celine Lee, Abdulrahman Mahmoud
cs.AI
Аннотация
Аппаратная экосистема стремительно развивается, и всё больше внимания уделяется переводу низкоуровневых программ между различными наборами команд (ISA) быстрым, гибким и корректным способом для повышения переносимости и долговечности существующего кода. Особенно сложным классом этой задачи трансляции является перевод между сложными (CISC) и упрощёнными (RISC) аппаратными архитектурами из-за фундаментальных различий в сложности команд, моделях памяти и парадигмах выполнения. В данной работе мы представляем GG (Guaranteed Guess), конвейер трансляции, ориентированный на ISA, который сочетает мощь предобученных больших языковых моделей (LLM) с строгостью устоявшихся конструкций тестирования программного обеспечения. Наш метод генерирует кандидаты на перевод с использованием LLM из одной ISA в другую и встраивает такие переводы в рамки тестирования программного обеспечения для построения количественной уверенности в корректности перевода. Мы оцениваем наш подход GG на двух разнообразных наборах данных, обеспечиваем высокое покрытие кода (>98%) в модульных тестах и достигаем функциональной/семантической корректности 99% для программ HumanEval и 49% для программ BringupBench. Кроме того, мы сравниваем наш подход с передовым фреймворком Rosetta 2 на Apple Silicon, демонстрируя 1.73-кратное ускорение времени выполнения, 1.47-кратное улучшение энергоэффективности и 2.41-кратное снижение использования памяти для нашего транслированного кода, что подтверждает эффективность GG для реальных задач перевода CISC-to-RISC. Мы опубликуем наши коды, данные, модели и бенчмарки в открытом доступе, чтобы создать общую основу для исследований в области трансляции кода на уровне ISA.
English
The hardware ecosystem is rapidly evolving, with increasing interest in
translating low-level programs across different instruction set architectures
(ISAs) in a quick, flexible, and correct way to enhance the portability and
longevity of existing code. A particularly challenging class of this
transpilation problem is translating between complex- (CISC) and reduced-
(RISC) hardware architectures, due to fundamental differences in instruction
complexity, memory models, and execution paradigms. In this work, we introduce
GG (Guaranteed Guess), an ISA-centric transpilation pipeline that combines the
translation power of pre-trained large language models (LLMs) with the rigor of
established software testing constructs. Our method generates candidate
translations using an LLM from one ISA to another, and embeds such translations
within a software-testing framework to build quantifiable confidence in the
translation. We evaluate our GG approach over two diverse datasets, enforce
high code coverage (>98%) across unit tests, and achieve functional/semantic
correctness of 99% on HumanEval programs and 49% on BringupBench programs,
respectively. Further, we compare our approach to the state-of-the-art Rosetta
2 framework on Apple Silicon, showcasing 1.73x faster runtime performance,
1.47x better energy efficiency, and 2.41x better memory usage for our
transpiled code, demonstrating the effectiveness of GG for real-world
CISC-to-RISC translation tasks. We will open-source our codes, data, models,
and benchmarks to establish a common foundation for ISA-level code translation
research.