Leuvenshtein: Effiziente FHE-basierte Berechnung der Editierdistanz mit einem Bootstrap pro Zelle
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell
August 20, 2025
papers.authors: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI
papers.abstract
Dieses Papier präsentiert einen neuartigen Ansatz zur Berechnung der Levenshtein- (Edit-) Distanz im Rahmen von Fully Homomorphic Encryption (FHE), wobei speziell drittgenerationelle Schemata wie TFHE im Fokus stehen. Berechnungen der Edit-Distanz sind in Anwendungen in den Bereichen Finanzen und Genomik, wie beispielsweise der DNA-Sequenzausrichtung, von entscheidender Bedeutung. Wir führen einen optimierten Algorithmus ein, der die Kosten für die Berechnung der Edit-Distanz erheblich reduziert und als Leuvenshtein bezeichnet wird. Dieser Algorithmus reduziert speziell die Anzahl der benötigten programmierbaren Bootstraps (PBS) pro Zelle der Berechnung von etwa 94 Operationen – wie sie der konventionelle Wagner-Fisher-Algorithmus erfordert – auf lediglich 1. Darüber hinaus schlagen wir eine effiziente Methode zur Durchführung von Gleichheitsprüfungen von Zeichen vor, die ASCII-Zeichenvergleiche auf nur 2 PBS-Operationen reduziert. Schließlich untersuchen wir das Potenzial für weitere Leistungssteigerungen durch die Nutzung von Vorverarbeitung, wenn einer der Eingabestrings unverschlüsselt ist. Unser Leuvenshtein erreicht eine bis zu 278-fach schnellere Leistung im Vergleich zur besten verfügbaren TFHE-Implementierung und eine bis zu 39-fach schnellere Leistung als eine optimierte Implementierung des Wagner-Fisher-Algorithmus. Zudem kann, wenn eine Offline-Vorverarbeitung aufgrund eines unverschlüsselten Eingabestrings auf der Serverseite möglich ist, eine zusätzliche 3-fache Beschleunigung erreicht werden.
English
This paper presents a novel approach to calculating the Levenshtein (edit)
distance within the framework of Fully Homomorphic Encryption (FHE),
specifically targeting third-generation schemes like TFHE. Edit distance
computations are essential in applications across finance and genomics, such as
DNA sequence alignment. We introduce an optimised algorithm that significantly
reduces the cost of edit distance calculations called Leuvenshtein. This
algorithm specifically reduces the number of programmable bootstraps (PBS)
needed per cell of the calculation, lowering it from approximately 94
operations -- required by the conventional Wagner-Fisher algorithm -- to just
1. Additionally, we propose an efficient method for performing equality checks
on characters, reducing ASCII character comparisons to only 2 PBS operations.
Finally, we explore the potential for further performance improvements by
utilising preprocessing when one of the input strings is unencrypted. Our
Leuvenshtein achieves up to 278times faster performance compared to the best
available TFHE implementation and up to 39times faster than an optimised
implementation of the Wagner-Fisher algorithm. Moreover, when offline
preprocessing is possible due to the presence of one unencrypted input on the
server side, an additional 3times speedup can be achieved.