Leuvenshtein: Calcolo Efficiente della Distanza di Modifica Basato su FHE con un Singolo Bootstrap per Cella
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell
August 20, 2025
Autori: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI
Abstract
Questo articolo presenta un approccio innovativo per il calcolo della distanza di Levenshtein (edit) all'interno del framework della Fully Homomorphic Encryption (FHE), con particolare attenzione agli schemi di terza generazione come TFHE. I calcoli della distanza di edit sono essenziali in applicazioni che spaziano dalla finanza alla genomica, come l'allineamento di sequenze di DNA. Introduciamo un algoritmo ottimizzato che riduce significativamente il costo dei calcoli della distanza di edit, denominato Leuvenshtein. Questo algoritmo riduce specificamente il numero di bootstraps programmabili (PBS) necessari per cella del calcolo, portandolo da circa 94 operazioni -- richieste dal convenzionale algoritmo di Wagner-Fisher -- a soltanto 1. Inoltre, proponiamo un metodo efficiente per eseguire controlli di uguaglianza sui caratteri, riducendo i confronti di caratteri ASCII a sole 2 operazioni PBS. Infine, esploriamo il potenziale per ulteriori miglioramenti delle prestazioni sfruttando il preprocessing quando una delle stringhe di input non è cifrata. Il nostro algoritmo Leuvenshtein raggiunge prestazioni fino a 278 volte più veloci rispetto alla migliore implementazione TFHE disponibile e fino a 39 volte più veloci rispetto a un'implementazione ottimizzata dell'algoritmo di Wagner-Fisher. Inoltre, quando è possibile eseguire un preprocessing offline grazie alla presenza di un input non cifrato lato server, è possibile ottenere un ulteriore aumento di velocità di 3 volte.
English
This paper presents a novel approach to calculating the Levenshtein (edit)
distance within the framework of Fully Homomorphic Encryption (FHE),
specifically targeting third-generation schemes like TFHE. Edit distance
computations are essential in applications across finance and genomics, such as
DNA sequence alignment. We introduce an optimised algorithm that significantly
reduces the cost of edit distance calculations called Leuvenshtein. This
algorithm specifically reduces the number of programmable bootstraps (PBS)
needed per cell of the calculation, lowering it from approximately 94
operations -- required by the conventional Wagner-Fisher algorithm -- to just
1. Additionally, we propose an efficient method for performing equality checks
on characters, reducing ASCII character comparisons to only 2 PBS operations.
Finally, we explore the potential for further performance improvements by
utilising preprocessing when one of the input strings is unencrypted. Our
Leuvenshtein achieves up to 278times faster performance compared to the best
available TFHE implementation and up to 39times faster than an optimised
implementation of the Wagner-Fisher algorithm. Moreover, when offline
preprocessing is possible due to the presence of one unencrypted input on the
server side, an additional 3times speedup can be achieved.