Leuvenshtein: Cálculo eficiente de la distancia de edición basado en FHE con un solo bootstrap por celda
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell
August 20, 2025
Autores: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI
Resumen
Este artículo presenta un enfoque novedoso para calcular la distancia de Levenshtein (edición) dentro del marco de la Cifra Totalmente Homomórfica (FHE, por sus siglas en inglés), centrándose específicamente en esquemas de tercera generación como TFHE. Los cálculos de distancia de edición son esenciales en aplicaciones de finanzas y genómica, como el alineamiento de secuencias de ADN. Introducimos un algoritmo optimizado que reduce significativamente el costo de los cálculos de distancia de edición, denominado Leuvenshtein. Este algoritmo reduce específicamente el número de arranques programables (PBS, por sus siglas en inglés) necesarios por celda del cálculo, disminuyéndolo de aproximadamente 94 operaciones —requeridas por el algoritmo convencional de Wagner-Fisher— a solo 1. Además, proponemos un método eficiente para realizar verificaciones de igualdad en caracteres, reduciendo las comparaciones de caracteres ASCII a solo 2 operaciones PBS. Finalmente, exploramos el potencial para mejoras adicionales en el rendimiento mediante la utilización de preprocesamiento cuando una de las cadenas de entrada no está cifrada. Nuestro algoritmo Leuvenshtein logra un rendimiento hasta 278 veces más rápido en comparación con la mejor implementación disponible de TFHE y hasta 39 veces más rápido que una implementación optimizada del algoritmo de Wagner-Fisher. Además, cuando es posible realizar preprocesamiento offline debido a la presencia de una entrada no cifrada en el lado del servidor, se puede lograr una aceleración adicional de 3 veces.
English
This paper presents a novel approach to calculating the Levenshtein (edit)
distance within the framework of Fully Homomorphic Encryption (FHE),
specifically targeting third-generation schemes like TFHE. Edit distance
computations are essential in applications across finance and genomics, such as
DNA sequence alignment. We introduce an optimised algorithm that significantly
reduces the cost of edit distance calculations called Leuvenshtein. This
algorithm specifically reduces the number of programmable bootstraps (PBS)
needed per cell of the calculation, lowering it from approximately 94
operations -- required by the conventional Wagner-Fisher algorithm -- to just
1. Additionally, we propose an efficient method for performing equality checks
on characters, reducing ASCII character comparisons to only 2 PBS operations.
Finally, we explore the potential for further performance improvements by
utilising preprocessing when one of the input strings is unencrypted. Our
Leuvenshtein achieves up to 278times faster performance compared to the best
available TFHE implementation and up to 39times faster than an optimised
implementation of the Wagner-Fisher algorithm. Moreover, when offline
preprocessing is possible due to the presence of one unencrypted input on the
server side, an additional 3times speedup can be achieved.