TAROT: Ofuscación de Autoría Orientada a Tareas Utilizando Métodos de Optimización de Políticas
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Autores: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Resumen
La obfuscación de autoría tiene como objetivo disfrazar la identidad de un autor dentro de un texto mediante la alteración del estilo de escritura, vocabulario, sintaxis y otras características lingüísticas asociadas con el autor del texto. Esta alteración debe equilibrar la privacidad y la utilidad. Si bien las técnicas de obfuscación sólidas pueden ocultar efectivamente la identidad del autor, a menudo degradan la calidad y utilidad del texto para su propósito previsto. Por otro lado, mantener una alta utilidad tiende a proporcionar una privacidad insuficiente, lo que facilita que un adversario desanonimize al autor. Por lo tanto, lograr un equilibrio óptimo entre estos dos objetivos conflictivos es crucial. En este documento, proponemos TAROT: Obfuscación de Autoría Orientada a Tareas Utilizando Optimización de Políticas, un nuevo método de obfuscación de autoría no supervisado cuyo objetivo es optimizar el equilibrio entre privacidad y utilidad al regenerar el texto completo considerando su utilidad descendente. Nuestro enfoque aprovecha la optimización de políticas como un paradigma de ajuste fino sobre pequeños modelos de lenguaje para reescribir textos preservando la identidad del autor y la utilidad de la tarea descendente. Mostramos que nuestro enfoque reduce en gran medida la precisión de los atacantes mientras se preserva la utilidad. Ponemos nuestro código y modelos a disposición del público.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.Summary
AI-Generated Summary