Анонимизация с помощью LLM для защиты от агентной реидентификации

Аннотация

Агентные LLM с веб-поиском изменяют модель угроз для анонимизации текста: слабые контекстуальные подсказки могут стать перекрестно ссылаемыми доказательствами для реидентификации, однако те же детали несут и последующую аналитическую ценность текста. Существующие защитные меры либо удаляют явные идентификаторы, искажают текст для формальной конфиденциальности, либо проверяют переписанный текст на моделях вывода без веб-поиска, оставляя недостаточно исследованной рабочую область между устойчивостью к агентной реидентификации через веб-поиск и сохранением полезности. Мы представляем AURA (Anonymization with Utility-Retention Adaptation — анонимизация с адаптацией сохранения полезности) — основанную на LLM структуру маскировки-восстановления, которая разделяет локализацию конфиденциальности и восстанавливающее сохранение полезности, и выбирает кандидатов с помощью проверок на устойчивость к атакам и сохранение полезности. Мы оцениваем AURA на стенограммах интервью реальных пользователей, используя атаки реидентификации, осуществляемые агентами веб-поиска, а также оценку полезности на основе фактов профиля интервьюируемого, фактов кодовой книги и совместной сетки контекстуальной полезности. Наши результаты показывают, что AURA улучшает границу конфиденциальность-полезность, используя адаптивный объем конфиденциальности для усиления устойчивости к агентной реидентификации и применяя метод анонимизации маскировки-восстановления для лучшего сохранения контекстуальной полезности при фиксированном объеме конфиденциальности.

English

Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become cross-referenceable evidence for re-identification, yet those same details also carry downstream analytic value of the text. Existing defenses either remove explicit identifiers, perturb text for formal privacy, or test rewritten text against non-web inference models, leaving underexplored the operating region between resistance to agentic web-search re-identification and utility retention. We introduce AURA (Anonymization with Utility-Retention Adaptation), an LLM-powered mask-reconstruct framework that decouples privacy localization from utility-preserving reconstruction and selects candidates with adversarial privacy and utility-retention checks. We evaluate AURA on real-user interview transcripts using re-identification attacks carried out by web-search agents, along with a utility evaluation based on interviewee-profile facts, codebook facts, and the joint contextual utility grid. Our results show that AURA improves the privacy-utility frontier by using adaptive privacy scope to strengthen resistance to agentic re-identification and using a mask-reconstruct anonymization method to better preserve contextual utility under fixed privacy scope.