ТАРО: Обфускация авторства, ориентированная на задачи, с использованием оптимизации политики методов
TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization Methods
July 31, 2024
Авторы: Gabriel Loiseau, Damien Sileo, Damien Riquet, Maxime Meyer, Marc Tommasi
cs.AI
Аннотация
Обфускация авторства направлена на скрытие личности автора в тексте путем изменения стиля письма, словарного запаса, синтаксиса и других лингвистических особенностей, связанных с автором текста. Это изменение должно сбалансировать конфиденциальность и полезность. Хотя сильные методы обфускации могут эффективно скрывать личность автора, они часто ухудшают качество и полезность текста для его предполагаемого назначения. Напротив, сохранение высокой полезности обычно обеспечивает недостаточную конфиденциальность, что упрощает деанонимизацию автора для противника. Таким образом, достижение оптимального баланса между этими двумя противоречащими целями критично. В данной статье мы предлагаем TAROT: Task-Oriented Authorship Obfuscation Using Policy Optimization, новый метод обфускации авторства без учителя, целью которого является оптимизация компромисса между конфиденциальностью и полезностью путем пересоздания всего текста с учетом его последующей полезности. Наш подход использует оптимизацию политики в качестве парадигмы настройки малых языковых моделей для переписывания текстов с сохранением идентичности автора и полезности для последующей задачи. Мы показываем, что наш подход в значительной степени снижает точность атакующих, сохраняя при этом полезность. Мы предоставляем наш код и модели общественности.
English
Authorship obfuscation aims to disguise the identity of an author within a
text by altering the writing style, vocabulary, syntax, and other linguistic
features associated with the text author. This alteration needs to balance
privacy and utility. While strong obfuscation techniques can effectively hide
the author's identity, they often degrade the quality and usefulness of the
text for its intended purpose. Conversely, maintaining high utility tends to
provide insufficient privacy, making it easier for an adversary to de-anonymize
the author. Thus, achieving an optimal trade-off between these two conflicting
objectives is crucial. In this paper, we propose TAROT: Task-Oriented
Authorship Obfuscation Using Policy Optimization, a new unsupervised authorship
obfuscation method whose goal is to optimize the privacy-utility trade-off by
regenerating the entire text considering its downstream utility. Our approach
leverages policy optimization as a fine-tuning paradigm over small language
models in order to rewrite texts by preserving author identity and downstream
task utility. We show that our approach largely reduce the accuracy of
attackers while preserving utility. We make our code and models publicly
available.Summary
AI-Generated Summary