ChatPaper.aiChatPaper

Leuvenshtein: Effiziente FHE-basierte Berechnung der Editierdistanz mit einem Bootstrap pro Zelle

Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell

August 20, 2025
papers.authors: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI

papers.abstract

Dieses Papier präsentiert einen neuartigen Ansatz zur Berechnung der Levenshtein- (Edit-) Distanz im Rahmen von Fully Homomorphic Encryption (FHE), wobei speziell drittgenerationelle Schemata wie TFHE im Fokus stehen. Berechnungen der Edit-Distanz sind in Anwendungen in den Bereichen Finanzen und Genomik, wie beispielsweise der DNA-Sequenzausrichtung, von entscheidender Bedeutung. Wir führen einen optimierten Algorithmus ein, der die Kosten für die Berechnung der Edit-Distanz erheblich reduziert und als Leuvenshtein bezeichnet wird. Dieser Algorithmus reduziert speziell die Anzahl der benötigten programmierbaren Bootstraps (PBS) pro Zelle der Berechnung von etwa 94 Operationen – wie sie der konventionelle Wagner-Fisher-Algorithmus erfordert – auf lediglich 1. Darüber hinaus schlagen wir eine effiziente Methode zur Durchführung von Gleichheitsprüfungen von Zeichen vor, die ASCII-Zeichenvergleiche auf nur 2 PBS-Operationen reduziert. Schließlich untersuchen wir das Potenzial für weitere Leistungssteigerungen durch die Nutzung von Vorverarbeitung, wenn einer der Eingabestrings unverschlüsselt ist. Unser Leuvenshtein erreicht eine bis zu 278-fach schnellere Leistung im Vergleich zur besten verfügbaren TFHE-Implementierung und eine bis zu 39-fach schnellere Leistung als eine optimierte Implementierung des Wagner-Fisher-Algorithmus. Zudem kann, wenn eine Offline-Vorverarbeitung aufgrund eines unverschlüsselten Eingabestrings auf der Serverseite möglich ist, eine zusätzliche 3-fache Beschleunigung erreicht werden.
English
This paper presents a novel approach to calculating the Levenshtein (edit) distance within the framework of Fully Homomorphic Encryption (FHE), specifically targeting third-generation schemes like TFHE. Edit distance computations are essential in applications across finance and genomics, such as DNA sequence alignment. We introduce an optimised algorithm that significantly reduces the cost of edit distance calculations called Leuvenshtein. This algorithm specifically reduces the number of programmable bootstraps (PBS) needed per cell of the calculation, lowering it from approximately 94 operations -- required by the conventional Wagner-Fisher algorithm -- to just 1. Additionally, we propose an efficient method for performing equality checks on characters, reducing ASCII character comparisons to only 2 PBS operations. Finally, we explore the potential for further performance improvements by utilising preprocessing when one of the input strings is unencrypted. Our Leuvenshtein achieves up to 278times faster performance compared to the best available TFHE implementation and up to 39times faster than an optimised implementation of the Wagner-Fisher algorithm. Moreover, when offline preprocessing is possible due to the presence of one unencrypted input on the server side, an additional 3times speedup can be achieved.
PDF12August 21, 2025