에이전트 재식별에 대한 LLM 익명화
LLM Anonymization Against Agentic Re-Identification
June 1, 2026
저자: Ziwen Li, Jianing Wen, Tianshi Li
cs.AI
초록
웹 검색이 가능한 에이전트형 LLM은 텍스트 익명화의 위협 모델을 변화시킨다. 약한 맥락적 단서가 재식별을 위한 상호 참조 가능한 증거가 될 수 있는 반면, 동일한 세부 사항은 텍스트의 후속 분석 가치도 지닌다. 기존 방어 기법은 명시적 식별자를 제거하거나, 공식적 프라이버시를 위해 텍스트를 교란하거나, 재작성된 텍스트를 비웹 추론 모델에 대해 테스트하는 방식으로, 에이전트형 웹 검색 재식별에 대한 저항력과 유용성 유지 사이의 작동 영역을 충분히 탐구하지 못하고 있다. 우리는 AURA(유용성 유지 적응형 익명화)를 소개한다. 이는 LLM 기반 마스크-재구성 프레임워크로, 프라이버시 지역화를 유용성 보존 재구성과 분리하고, 적대적 프라이버시 및 유용성 유지 검사를 통해 후보를 선별한다. 우리는 실제 사용자 인터뷰 대본을 대상으로 웹 검색 에이전트가 수행하는 재식별 공격을 사용하여 AURA를 평가하고, 인터뷰 대상자 프로필 사실, 코드북 사실, 그리고 결합 맥락적 유용성 그리드에 기반한 유용성 평가를 함께 수행한다. 우리의 결과는 AURA가 적응형 프라이버시 범위를 사용하여 에이전트형 재식별에 대한 저항력을 강화하고, 고정된 프라이버시 범위 하에서 마스크-재구성 익명화 방법을 사용하여 맥락적 유용성을 더 잘 보존함으로써 프라이버시-유용성 경계를 개선함을 보여준다.
English
Agentic LLMs with web search change the threat model for text anonymization: weak contextual cues can become cross-referenceable evidence for re-identification, yet those same details also carry downstream analytic value of the text. Existing defenses either remove explicit identifiers, perturb text for formal privacy, or test rewritten text against non-web inference models, leaving underexplored the operating region between resistance to agentic web-search re-identification and utility retention. We introduce AURA (Anonymization with Utility-Retention Adaptation), an LLM-powered mask-reconstruct framework that decouples privacy localization from utility-preserving reconstruction and selects candidates with adversarial privacy and utility-retention checks. We evaluate AURA on real-user interview transcripts using re-identification attacks carried out by web-search agents, along with a utility evaluation based on interviewee-profile facts, codebook facts, and the joint contextual utility grid. Our results show that AURA improves the privacy-utility frontier by using adaptive privacy scope to strengthen resistance to agentic re-identification and using a mask-reconstruct anonymization method to better preserve contextual utility under fixed privacy scope.