ChatPaper.aiChatPaper

TAROT: ポリシー最適化を用いたタスク指向型著者匿名化手法

TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods

July 31, 2024
著者: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI

要旨

著作権隠蔽は、テキスト内の著者のアイデンティティを、そのテキストの著者に関連する文体、語彙、構文、その他の言語的特徴を変更することで偽装することを目的としています。この変更は、プライバシーと有用性のバランスを取る必要があります。強力な隠蔽技術は著者のアイデンティティを効果的に隠すことができますが、しばしばテキストの品質とその目的に対する有用性を低下させます。逆に、高い有用性を維持すると、プライバシーが不十分になり、攻撃者が著者を特定しやすくなります。したがって、これらの相反する目的の間で最適なトレードオフを達成することが重要です。本論文では、TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimizationを提案します。これは、下流の有用性を考慮してテキスト全体を再生成することで、プライバシーと有用性のトレードオフを最適化することを目的とした新しい教師なし著作権隠蔽手法です。私たちのアプローチは、ポリシー最適化を活用し、小さな言語モデルを微調整するパラダイムとして使用して、著者のアイデンティティと下流タスクの有用性を保持しながらテキストを書き換えます。私たちのアプローチが、有用性を保持しながら攻撃者の精度を大幅に低減することを示します。私たちは、コードとモデルを公開しています。
English
Authorship obfuscation aims to disguise the identity of an author within a text by altering the writing style, vocabulary, syntax, and other linguistic features associated with the text author. This alteration needs to balance privacy and utility. While strong obfuscation techniques can effectively hide the author's identity, they often degrade the quality and usefulness of the text for its intended purpose. Conversely, maintaining high utility tends to provide insufficient privacy, making it easier for an adversary to de-anonymize the author. Thus, achieving an optimal trade-off between these two conflicting objectives is crucial. In this paper, we propose TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship obfuscation method whose goal is to optimize the privacy-utility trade-off by regenerating the entire text considering its downstream utility. Our approach leverages policy optimization as a fine-tuning paradigm over small language models in order to rewrite texts by preserving author identity and downstream task utility. We show that our approach largely reduce the accuracy of attackers while preserving utility. We make our code and models publicly available.

Summary

AI-Generated Summary

PDF82November 28, 2024