Leuvenshtein : Calcul efficace de la distance d'édition basé sur FHE avec un seul bootstrap par cellule
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell
August 20, 2025
papers.authors: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI
papers.abstract
Cet article présente une nouvelle approche pour le calcul de la distance de Levenshtein (ou distance d'édition) dans le cadre du chiffrement entièrement homomorphe (FHE), en ciblant spécifiquement les schémas de troisième génération tels que TFHE. Les calculs de distance d'édition sont essentiels dans des applications variées, notamment en finance et en génomique, comme l'alignement de séquences d'ADN. Nous introduisons un algorithme optimisé, appelé Leuvenshtein, qui réduit significativement le coût des calculs de distance d'édition. Cet algorithme diminue particulièrement le nombre de bootstraps programmables (PBS) nécessaires par cellule de calcul, le faisant passer d'environ 94 opérations — requises par l'algorithme conventionnel de Wagner-Fisher — à seulement 1. De plus, nous proposons une méthode efficace pour effectuer des vérifications d'égalité sur les caractères, réduisant les comparaisons de caractères ASCII à seulement 2 opérations PBS. Enfin, nous explorons le potentiel d'améliorations supplémentaires des performances en utilisant un prétraitement lorsque l'une des chaînes d'entrée est non chiffrée. Notre algorithme Leuvenshtein atteint des performances jusqu'à 278 fois plus rapides que la meilleure implémentation TFHE disponible et jusqu'à 39 fois plus rapides qu'une implémentation optimisée de l'algorithme de Wagner-Fisher. Par ailleurs, lorsqu'un prétraitement hors ligne est possible grâce à la présence d'une entrée non chiffrée côté serveur, une accélération supplémentaire de 3 fois peut être obtenue.
English
This paper presents a novel approach to calculating the Levenshtein (edit)
distance within the framework of Fully Homomorphic Encryption (FHE),
specifically targeting third-generation schemes like TFHE. Edit distance
computations are essential in applications across finance and genomics, such as
DNA sequence alignment. We introduce an optimised algorithm that significantly
reduces the cost of edit distance calculations called Leuvenshtein. This
algorithm specifically reduces the number of programmable bootstraps (PBS)
needed per cell of the calculation, lowering it from approximately 94
operations -- required by the conventional Wagner-Fisher algorithm -- to just
1. Additionally, we propose an efficient method for performing equality checks
on characters, reducing ASCII character comparisons to only 2 PBS operations.
Finally, we explore the potential for further performance improvements by
utilising preprocessing when one of the input strings is unencrypted. Our
Leuvenshtein achieves up to 278times faster performance compared to the best
available TFHE implementation and up to 39times faster than an optimised
implementation of the Wagner-Fisher algorithm. Moreover, when offline
preprocessing is possible due to the presence of one unencrypted input on the
server side, an additional 3times speedup can be achieved.