Anonimización de LLM contra la reidentificación agéntica

Resumen

Los LLMs agentivos con búsqueda web modifican el modelo de amenaza para la anonimización de texto: indicios contextuales débiles pueden convertirse en evidencia referenciable de forma cruzada para la reidentificación, aunque esos mismos detalles también poseen valor analítico posterior del texto. Las defensas existentes eliminan identificadores explícitos, perturban el texto para lograr privacidad formal o evalúan el texto reescrito frente a modelos de inferencia no web, dejando poco explorada la región operativa entre la resistencia a la reidentificación mediante búsqueda web agéntica y la retención de utilidad. Presentamos AURA (Anonimización con Adaptación de Retención de Utilidad), un marco de enmascaramiento y reconstrucción impulsado por LLM que desacopla la localización de la privacidad de la reconstrucción que preserva la utilidad y selecciona candidatos mediante verificaciones adversariales de privacidad y retención de utilidad. Evaluamos AURA en transcripciones de entrevistas con usuarios reales utilizando ataques de reidentificación llevados a cabo por agentes de búsqueda web, junto con una evaluación de utilidad basada en hechos del perfil del entrevistado, hechos del libro de códigos y la cuadrícula de utilidad contextual conjunta. Nuestros resultados muestran que AURA mejora la frontera privacidad-utilidad al emplear un alcance de privacidad adaptativo para fortalecer la resistencia a la reidentificación agéntica y utilizar un método de anonimización de enmascaramiento y reconstrucción para preservar mejor la utilidad contextual bajo un alcance de privacidad fijo.

English

Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become cross-referenceable evidence for re-identification, yet those same details also carry downstream analytic value of the text. Existing defenses either remove explicit identifiers, perturb text for formal privacy, or test rewritten text against non-web inference models, leaving underexplored the operating region between resistance to agentic web-search re-identification and utility retention. We introduce AURA (Anonymization with Utility-Retention Adaptation), an LLM-powered mask-reconstruct framework that decouples privacy localization from utility-preserving reconstruction and selects candidates with adversarial privacy and utility-retention checks. We evaluate AURA on real-user interview transcripts using re-identification attacks carried out by web-search agents, along with a utility evaluation based on interviewee-profile facts, codebook facts, and the joint contextual utility grid. Our results show that AURA improves the privacy-utility frontier by using adaptive privacy scope to strengthen resistance to agentic re-identification and using a mask-reconstruct anonymization method to better preserve contextual utility under fixed privacy scope.