TAROT : Obfuscation d'Autorat Orientée Tâche par Optimisation de Politique
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Auteurs: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Résumé
L'obfuscation de paternité vise à masquer l'identité d'un auteur dans un texte en modifiant le style d'écriture, le vocabulaire, la syntaxe et d'autres caractéristiques linguistiques associées à l'auteur du texte. Cette altération doit équilibrer confidentialité et utilité. Bien que des techniques d'obfuscation robustes puissent efficacement dissimuler l'identité de l'auteur, elles dégradent souvent la qualité et l'utilité du texte pour son objectif initial. Inversement, maintenir une utilité élevée tend à offrir une confidentialité insuffisante, facilitant la désanonymisation de l'auteur par un adversaire. Ainsi, parvenir à un compromis optimal entre ces deux objectifs conflictuels est crucial. Dans cet article, nous proposons TAROT : Obfuscation de Paternité Orientée Tâche Utilisant l'Optimisation de Politique, une nouvelle méthode non supervisée d'obfuscation de paternité dont le but est d'optimiser le compromis confidentialité-utilité en régénérant l'intégralité du texte en tenant compte de son utilité en aval. Notre approche exploite l'optimisation de politique comme paradigme de fine-tuning sur des modèles de langage de petite taille afin de réécrire les textes en préservant l'identité de l'auteur et l'utilité pour la tâche en aval. Nous montrons que notre approche réduit considérablement la précision des attaquants tout en préservant l'utilité. Nous mettons notre code et nos modèles à disposition du public.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.Summary
AI-Generated Summary