Anonymisation par LLM contre la ré-identification agentique

Résumé

Les LLM agentiques avec recherche web modifient le modèle de menace pour l’anonymisation de texte : de faibles indices contextuels peuvent devenir des preuves référençables pour la ré-identification, tandis que ces mêmes détails conservent une valeur analytique en aval du texte. Les défenses existantes suppriment soit les identifiants explicites, perturbent le texte pour une confidentialité formelle, ou testent le texte réécrit contre des modèles d’inférence non web, laissant inexplorée la zone opérationnelle entre la résistance à la ré-identification par recherche web agentique et la rétention d’utilité. Nous présentons AURA (Anonymisation avec Adaptation de Rétention d’Utilité), un cadre de masquage-reconstruction piloté par LLM qui découple la localisation de la confidentialité de la reconstruction préservant l’utilité et sélectionne des candidats par des vérifications adversariales de confidentialité et de rétention d’utilité. Nous évaluons AURA sur des transcriptions d’entretiens d’utilisateurs réels en utilisant des attaques de ré-identification menées par des agents de recherche web, ainsi qu’une évaluation de l’utilité basée sur les faits de profil des interviewés, les faits du codebook et la grille d’utilité contextuelle conjointe. Nos résultats montrent qu’AURA améliore la frontière confidentialité-utilité en utilisant une portée adaptative de la confidentialité pour renforcer la résistance à la ré-identification agentique, et en employant une méthode d’anonymisation par masquage-reconstruction pour mieux préserver l’utilité contextuelle sous une portée de confidentialité fixe.

English

Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become cross-referenceable evidence for re-identification, yet those same details also carry downstream analytic value of the text. Existing defenses either remove explicit identifiers, perturb text for formal privacy, or test rewritten text against non-web inference models, leaving underexplored the operating region between resistance to agentic web-search re-identification and utility retention. We introduce AURA (Anonymization with Utility-Retention Adaptation), an LLM-powered mask-reconstruct framework that decouples privacy localization from utility-preserving reconstruction and selects candidates with adversarial privacy and utility-retention checks. We evaluate AURA on real-user interview transcripts using re-identification attacks carried out by web-search agents, along with a utility evaluation based on interviewee-profile facts, codebook facts, and the joint contextual utility grid. Our results show that AURA improves the privacy-utility frontier by using adaptive privacy scope to strengthen resistance to agentic re-identification and using a mask-reconstruct anonymization method to better preserve contextual utility under fixed privacy scope.