ChatPaper.aiChatPaper

SEAL: Marcas de agua entrelazadas en caja blanca en adaptación de rango bajo

SEAL: Entangled White-box Watermarks on Low-Rank Adaptation

January 16, 2025
Autores: Giyeong Oh, Saejin Kim, Woohyun Cho, Sangkyu Lee, Jiwan Chung, Dokyung Song, Youngjae Yu
cs.AI

Resumen

Recientemente, LoRA y sus variantes se han convertido en la estrategia por defecto para entrenar y compartir versiones específicas de tareas de modelos preentrenados grandes, gracias a su eficiencia y simplicidad. Sin embargo, el tema de la protección de derechos de autor para los pesos de LoRA, especialmente a través de técnicas basadas en marcas de agua, sigue siendo poco explorado. Para abordar esta brecha, proponemos SEAL (SEcure wAtermarking on LoRA weights), el marcaje de agua universal en caja blanca para LoRA. SEAL incrusta una matriz secreta y no entrenable entre los pesos entrenables de LoRA, sirviendo como un pasaporte para reclamar la propiedad. Luego, SEAL entrelaza el pasaporte con los pesos de LoRA a través del entrenamiento, sin pérdida adicional por el entrelazamiento, y distribuye los pesos ajustados después de ocultar el pasaporte. Al aplicar SEAL, no observamos degradación del rendimiento en tareas de razonamiento de sentido común, ajuste de instrucciones textuales/visuales y síntesis de texto a imagen. Demostramos que SEAL es resistente a una variedad de ataques conocidos: eliminación, ofuscación y ataques de ambigüedad.
English
Recently, LoRA and its variants have become the de facto strategy for training and sharing task-specific versions of large pretrained models, thanks to their efficiency and simplicity. However, the issue of copyright protection for LoRA weights, especially through watermark-based techniques, remains underexplored. To address this gap, we propose SEAL (SEcure wAtermarking on LoRA weights), the universal whitebox watermarking for LoRA. SEAL embeds a secret, non-trainable matrix between trainable LoRA weights, serving as a passport to claim ownership. SEAL then entangles the passport with the LoRA weights through training, without extra loss for entanglement, and distributes the finetuned weights after hiding the passport. When applying SEAL, we observed no performance degradation across commonsense reasoning, textual/visual instruction tuning, and text-to-image synthesis tasks. We demonstrate that SEAL is robust against a variety of known attacks: removal, obfuscation, and ambiguity attacks.

Summary

AI-Generated Summary

PDF102January 21, 2025