ChatPaper.aiChatPaper

SEAL: Marcas d'água enredadas em caixas brancas em adaptação de baixa patente

SEAL: Entangled White-box Watermarks on Low-Rank Adaptation

January 16, 2025
Autores: Giyeong Oh, Saejin Kim, Woohyun Cho, Sangkyu Lee, Jiwan Chung, Dokyung Song, Youngjae Yu
cs.AI

Resumo

Recentemente, LoRA e suas variantes se tornaram a estratégia padrão para treinar e compartilhar versões específicas de tarefas de grandes modelos pré-treinados, graças à sua eficiência e simplicidade. No entanto, a questão da proteção de direitos autorais para os pesos do LoRA, especialmente por meio de técnicas baseadas em marca d'água, permanece pouco explorada. Para abordar essa lacuna, propomos o SEAL (SEcure wAtermarking on LoRA weights), a marca d'água universal de caixa branca para LoRA. O SEAL incorpora uma matriz secreta e não treinável entre os pesos treináveis do LoRA, servindo como um passaporte para reivindicar a propriedade. Em seguida, o SEAL entrelaça o passaporte com os pesos do LoRA por meio do treinamento, sem perda adicional para o entrelaçamento, e distribui os pesos ajustados após ocultar o passaporte. Ao aplicar o SEAL, não observamos degradação de desempenho em tarefas de raciocínio comum, ajuste de instruções textuais/visuais e síntese de texto para imagem. Demonstramos que o SEAL é robusto contra uma variedade de ataques conhecidos: remoção, obfuscação e ataques de ambiguidade.
English
Recently, LoRA and its variants have become the de facto strategy for training and sharing task-specific versions of large pretrained models, thanks to their efficiency and simplicity. However, the issue of copyright protection for LoRA weights, especially through watermark-based techniques, remains underexplored. To address this gap, we propose SEAL (SEcure wAtermarking on LoRA weights), the universal whitebox watermarking for LoRA. SEAL embeds a secret, non-trainable matrix between trainable LoRA weights, serving as a passport to claim ownership. SEAL then entangles the passport with the LoRA weights through training, without extra loss for entanglement, and distributes the finetuned weights after hiding the passport. When applying SEAL, we observed no performance degradation across commonsense reasoning, textual/visual instruction tuning, and text-to-image synthesis tasks. We demonstrate that SEAL is robust against a variety of known attacks: removal, obfuscation, and ambiguity attacks.

Summary

AI-Generated Summary

PDF102January 21, 2025