TAROT: Taakgericht Auteurschap Obfuscatie met Beleidsoptimalisatiemethoden
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Auteurs: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Samenvatting
Auteurschapobfuscatie heeft als doel de identiteit van een auteur binnen een tekst te verhullen door de schrijfstijl, woordenschat, syntaxis en andere linguïstische kenmerken die aan de tekst auteur zijn verbonden, aan te passen. Deze aanpassing moet een balans vinden tussen privacy en bruikbaarheid. Hoewel sterke obfuscatietechnieken effectief de identiteit van de auteur kunnen verbergen, verslechteren ze vaak de kwaliteit en het nut van de tekst voor het beoogde doel. Omgekeerd biedt het handhaven van een hoge bruikbaarheid meestal onvoldoende privacy, waardoor het voor een tegenstander gemakkelijker wordt om de auteur te de-anonimiseren. Het bereiken van een optimale afweging tussen deze twee tegenstrijdige doelstellingen is daarom cruciaal. In dit artikel stellen we TAROT voor: Task-Oriented Authorship Obfuscation Using Policy Optimization, een nieuwe onbewaakte auteurschapobfuscatiemethode die als doel heeft de privacy-bruikbaarheid afweging te optimaliseren door de gehele tekst opnieuw te genereren met inachtneming van de downstream bruikbaarheid. Onze aanpak maakt gebruik van beleidsoptimalisatie als een fine-tuning paradigma over kleine taalmodellen om teksten te herschrijven met behoud van de auteursidentiteit en de bruikbaarheid voor downstream taken. We tonen aan dat onze aanpak de nauwkeurigheid van aanvallers aanzienlijk vermindert terwijl de bruikbaarheid behouden blijft. We stellen onze code en modellen publiekelijk beschikbaar.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.