TAROT: Ofuscação de Autoria Orientada por Tarefas Usando Otimização de Políticas Métodos
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Autores: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Resumo
A obfuscação de autoria tem como objetivo disfarçar a identidade de um autor dentro de um texto, alterando o estilo de escrita, vocabulário, sintaxe e outras características linguísticas associadas ao autor do texto. Essa alteração precisa equilibrar privacidade e utilidade. Enquanto técnicas fortes de obfuscação podem efetivamente ocultar a identidade do autor, frequentemente degradam a qualidade e utilidade do texto para o seu propósito pretendido. Por outro lado, manter uma alta utilidade tende a fornecer privacidade insuficiente, tornando mais fácil para um adversário desanonimizar o autor. Assim, alcançar um equilíbrio ótimo entre esses dois objetivos conflitantes é crucial. Neste artigo, propomos TAROT: Obfuscação de Autoria Orientada por Tarefas Usando Otimização de Políticas, um novo método de obfuscação de autoria não supervisionado cujo objetivo é otimizar o equilíbrio entre privacidade e utilidade, regenerando o texto inteiro considerando sua utilidade downstream. Nossa abordagem aproveita a otimização de políticas como um paradigma de ajuste fino sobre pequenos modelos de linguagem para reescrever textos preservando a identidade do autor e a utilidade da tarefa downstream. Mostramos que nossa abordagem reduz significativamente a precisão dos atacantes enquanto preserva a utilidade. Disponibilizamos nosso código e modelos publicamente.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.Summary
AI-Generated Summary