TAROT: Offuscamento dell'Autorialità Orientato al Compito Utilizzando Metodi di Ottimizzazione delle Politiche
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Autori: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Abstract
L'offuscamento dell'autore mira a mascherare l'identità di un autore all'interno di un testo alterando lo stile di scrittura, il vocabolario, la sintassi e altre caratteristiche linguistiche associate all'autore del testo. Questa alterazione deve bilanciare privacy e utilità. Mentre tecniche di offuscamento robuste possono nascondere efficacemente l'identità dell'autore, spesso degradano la qualità e l'utilità del testo per il suo scopo originario. Al contrario, mantenere un'elevata utilità tende a fornire una privacy insufficiente, rendendo più semplice per un avversario de-anonimizzare l'autore. Pertanto, raggiungere un compromesso ottimale tra questi due obiettivi contrastanti è cruciale. In questo articolo, proponiamo TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization, un nuovo metodo di offuscamento dell'autore non supervisionato il cui obiettivo è ottimizzare il compromesso tra privacy e utilità rigenerando l'intero testo considerando la sua utilità a valle. Il nostro approccio sfrutta l'ottimizzazione delle politiche come paradigma di fine-tuning su modelli linguistici di piccole dimensioni per riscrivere i testi preservando l'identità dell'autore e l'utilità del task a valle. Dimostriamo che il nostro approccio riduce significativamente l'accuratezza degli attaccanti preservando l'utilità. Rendiamo pubblicamente disponibili il nostro codice e i nostri modelli.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.