ChatPaper.aiChatPaper

Modellimmunisierung aus der Perspektive der Konditionszahl

Model Immunization from a Condition Number Perspective

May 29, 2025
Autoren: Amber Yijia Zheng, Cedar Site Bai, Brian Bullins, Raymond A. Yeh
cs.AI

Zusammenfassung

Die Modellimmunisierung zielt darauf ab, Modelle vorzutrainieren, die schwer auf schädliche Aufgaben feinabzustimmen sind, während ihre Nützlichkeit für andere nicht-schädliche Aufgaben erhalten bleibt. Obwohl frühere Arbeiten empirische Belege für die Immunisierung von Text-zu-Bild-Modellen gezeigt haben, bleibt das grundlegende Verständnis darüber, wann Immunisierung möglich ist, sowie eine präzise Definition eines immunisierten Modells unklar. In dieser Arbeit schlagen wir ein Framework vor, das auf der Konditionszahl einer Hessematrix basiert, um die Modellimmunisierung für lineare Modelle zu analysieren. Aufbauend auf diesem Framework entwickeln wir einen Algorithmus mit Regularisierungstermen, um die resultierenden Konditionszahlen nach dem Vortraining zu steuern. Empirische Ergebnisse an linearen Modellen und nicht-linearen Deep-Nets demonstrieren die Wirksamkeit des vorgeschlagenen Algorithmus zur Modellimmunisierung. Der Code ist verfügbar unter https://github.com/amberyzheng/model-immunization-cond-num.
English
Model immunization aims to pre-train models that are difficult to fine-tune on harmful tasks while retaining their utility on other non-harmful tasks. Though prior work has shown empirical evidence for immunizing text-to-image models, the key understanding of when immunization is possible and a precise definition of an immunized model remain unclear. In this work, we propose a framework, based on the condition number of a Hessian matrix, to analyze model immunization for linear models. Building on this framework, we design an algorithm with regularization terms to control the resulting condition numbers after pre-training. Empirical results on linear models and non-linear deep-nets demonstrate the effectiveness of the proposed algorithm on model immunization. The code is available at https://github.com/amberyzheng/model-immunization-cond-num.
PDF82June 10, 2025