TAROT: Aufgabenorientierte Autorenschaftsverschleierung mit Hilfe von Richtlinienoptimierungsmethoden
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Autoren: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Zusammenfassung
Die Autorenschaftsverschleierung zielt darauf ab, die Identität eines Autors innerhalb eines Textes zu verschleiern, indem der Schreibstil, der Wortschatz, die Syntax und andere linguistische Merkmale, die mit dem Textautor in Verbindung stehen, verändert werden. Diese Veränderung muss die Balance zwischen Datenschutz und Nützlichkeit wahren. Während starke Verschleierungstechniken die Identität des Autors effektiv verbergen können, führen sie oft zu einer Verschlechterung der Qualität und Nützlichkeit des Textes für seinen beabsichtigten Zweck. Im Gegensatz dazu führt die Aufrechterhaltung hoher Nützlichkeit tendenziell zu unzureichendem Datenschutz, was es einem Angreifer erleichtert, den Autor zu de-anonymisieren. Daher ist es entscheidend, einen optimalen Kompromiss zwischen diesen beiden sich widersprechenden Zielen zu erreichen. In diesem Paper schlagen wir TAROT vor: Task-Oriented Autorenschaftsverschleierung unter Verwendung von Policy-Optimierung, eine neue unüberwachte Autorenschaftsverschleierungsmethode, deren Ziel es ist, den Datenschutz-Nützlichkeits-Kompromiss zu optimieren, indem der gesamte Text unter Berücksichtigung seiner nachgelagerten Nützlichkeit neu generiert wird. Unser Ansatz nutzt die Policy-Optimierung als Feinabstimmungsparadigma über kleinen Sprachmodellen, um Texte umzuschreiben, indem die Autorenidentität und die nachgelagerte Aufgabennützlichkeit erhalten bleiben. Wir zeigen, dass unser Ansatz die Genauigkeit von Angreifern weitgehend reduziert, während die Nützlichkeit erhalten bleibt. Wir stellen unseren Code und unsere Modelle öffentlich zur Verfügung.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.Summary
AI-Generated Summary