Leuvenshtein: Cálculo Eficiente de Distância de Edição Baseado em FHE com uma Única Bootstrap por Célula
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell
August 20, 2025
Autores: Wouter Legiest, Jan-Pieter D'Anvers, Bojan Spasic, Nam-Luc Tran, Ingrid Verbauwhede
cs.AI
Resumo
Este artigo apresenta uma nova abordagem para calcular a distância de Levenshtein (edição) no contexto da Criptografia Totalmente Homomórfica (FHE), com foco específico em esquemas de terceira geração como o TFHE. Cálculos de distância de edição são essenciais em aplicações nas áreas de finanças e genômica, como o alinhamento de sequências de DNA. Introduzimos um algoritmo otimizado que reduz significativamente o custo dos cálculos de distância de edição, denominado Leuvenshtein. Esse algoritmo reduz especificamente o número de bootstraps programáveis (PBS) necessários por célula do cálculo, diminuindo de aproximadamente 94 operações -- exigidas pelo algoritmo convencional de Wagner-Fisher -- para apenas 1. Além disso, propomos um método eficiente para realizar verificações de igualdade de caracteres, reduzindo as comparações de caracteres ASCII para apenas 2 operações PBS. Por fim, exploramos o potencial para melhorias adicionais de desempenho utilizando pré-processamento quando uma das strings de entrada não está criptografada. Nosso algoritmo Leuvenshtein alcança um desempenho até 278 vezes mais rápido em comparação com a melhor implementação disponível do TFHE e até 39 vezes mais rápido que uma implementação otimizada do algoritmo de Wagner-Fisher. Além disso, quando o pré-processamento offline é possível devido à presença de uma entrada não criptografada no lado do servidor, um ganho adicional de 3 vezes em velocidade pode ser obtido.
English
This paper presents a novel approach to calculating the Levenshtein (edit)
distance within the framework of Fully Homomorphic Encryption (FHE),
specifically targeting third-generation schemes like TFHE. Edit distance
computations are essential in applications across finance and genomics, such as
DNA sequence alignment. We introduce an optimised algorithm that significantly
reduces the cost of edit distance calculations called Leuvenshtein. This
algorithm specifically reduces the number of programmable bootstraps (PBS)
needed per cell of the calculation, lowering it from approximately 94
operations -- required by the conventional Wagner-Fisher algorithm -- to just
1. Additionally, we propose an efficient method for performing equality checks
on characters, reducing ASCII character comparisons to only 2 PBS operations.
Finally, we explore the potential for further performance improvements by
utilising preprocessing when one of the input strings is unencrypted. Our
Leuvenshtein achieves up to 278times faster performance compared to the best
available TFHE implementation and up to 39times faster than an optimised
implementation of the Wagner-Fisher algorithm. Moreover, when offline
preprocessing is possible due to the presence of one unencrypted input on the
server side, an additional 3times speedup can be achieved.