ポジション:プライバシーは単なる記憶化ではない!
Position: Privacy Is Not Just Memorization!
October 2, 2025
著者: Niloofar Mireshghallah, Tianshi Li
cs.AI
要旨
大規模言語モデル(LLMs)におけるプライバシーリスクに関する議論は、訓練データの逐語的な記憶に偏重しており、より即時的でスケーラブルなプライバシー脅威の多様性が十分に検討されていない。本ポジションペーパーでは、LLMシステムのプライバシーリスクは、訓練データの抽出をはるかに超えて、データ収集手法、推論時のコンテキスト漏洩、自律エージェントの能力、深層推論攻撃を通じた監視の民主化などに及ぶことを論じる。LLMのライフサイクル全体(データ収集からデプロイメントまで)にわたるプライバシーリスクの包括的分類を提示し、ケーススタディを通じて、現在のプライバシーフレームワークがこれらの多面的な脅威に対処できていないことを示す。過去10年間(2016年~2025年)に主要な学会で発表された1,322件のAI/MLプライバシー論文の縦断的分析を通じて、記憶化が技術研究で過剰に注目される一方で、最も差し迫ったプライバシー被害は他の領域に存在し、現在の技術的アプローチではほとんど進展が見られず、有効な解決策が未だ不明瞭であることを明らかにする。研究コミュニティがLLMプライバシーに取り組む方法の根本的な転換を求め、現在の技術的解決策の狭い焦点を超え、これらの新興脅威の社会技術的性質に対処する学際的アプローチを採用することを提唱する。
English
The discourse on privacy risks in Large Language Models (LLMs) has
disproportionately focused on verbatim memorization of training data, while a
constellation of more immediate and scalable privacy threats remain
underexplored. This position paper argues that the privacy landscape of LLM
systems extends far beyond training data extraction, encompassing risks from
data collection practices, inference-time context leakage, autonomous agent
capabilities, and the democratization of surveillance through deep inference
attacks. We present a comprehensive taxonomy of privacy risks across the LLM
lifecycle -- from data collection through deployment -- and demonstrate through
case studies how current privacy frameworks fail to address these multifaceted
threats. Through a longitudinal analysis of 1,322 AI/ML privacy papers
published at leading conferences over the past decade (2016--2025), we reveal
that while memorization receives outsized attention in technical research, the
most pressing privacy harms lie elsewhere, where current technical approaches
offer little traction and viable paths forward remain unclear. We call for a
fundamental shift in how the research community approaches LLM privacy, moving
beyond the narrow focus of current technical solutions and embracing
interdisciplinary approaches that address the sociotechnical nature of these
emerging threats.