Maschinelles Verlernen für Bild-zu-Bild-Generative Modelle

papers.abstract

Machine Unlearning hat sich als neues Paradigma etabliert, um gezielt Datenproben aus einem gegebenen Modell zu vergessen, um strengen Vorschriften zu entsprechen. Bisher konzentrierten sich bestehende Methoden des Machine Unlearning jedoch hauptsächlich auf Klassifikationsmodelle, wodurch die Landschaft des Unlearning für generative Modelle weitgehend unerforscht blieb. Diese Arbeit schließt diese Lücke, indem sie einen vereinheitlichenden Rahmen für Machine Unlearning bei Bild-zu-Bild-generativen Modellen bietet. Innerhalb dieses Rahmens schlagen wir einen recheneffizienten Algorithmus vor, der durch eine rigorose theoretische Analyse untermauert ist und eine vernachlässigbare Leistungsverschlechterung bei den Behaltproben zeigt, während er die Informationen der Vergessproben effektiv entfernt. Empirische Studien an zwei groß angelegten Datensätzen, ImageNet-1K und Places-365, zeigen weiterhin, dass unser Algorithmus nicht auf die Verfügbarkeit der Behaltproben angewiesen ist, was zusätzlich der Datenaufbewahrungspolitik entspricht. Nach bestem Wissen ist diese Arbeit die erste, die systematische, theoretische und empirische Untersuchungen des Machine Unlearning speziell für Bild-zu-Bild-generative Modelle darstellt. Unser Code ist verfügbar unter https://github.com/jpmorganchase/l2l-generator-unlearning.

English

Machine unlearning has emerged as a new paradigm to deliberately forget data samples from a given model in order to adhere to stringent regulations. However, existing machine unlearning methods have been primarily focused on classification models, leaving the landscape of unlearning for generative models relatively unexplored. This paper serves as a bridge, addressing the gap by providing a unifying framework of machine unlearning for image-to-image generative models. Within this framework, we propose a computationally-efficient algorithm, underpinned by rigorous theoretical analysis, that demonstrates negligible performance degradation on the retain samples, while effectively removing the information from the forget samples. Empirical studies on two large-scale datasets, ImageNet-1K and Places-365, further show that our algorithm does not rely on the availability of the retain samples, which further complies with data retention policy. To our best knowledge, this work is the first that represents systemic, theoretical, empirical explorations of machine unlearning specifically tailored for image-to-image generative models. Our code is available at https://github.com/jpmorganchase/l2l-generator-unlearning.

Maschinelles Verlernen für Bild-zu-Bild-Generative Modelle

Machine Unlearning for Image-to-Image Generative Models

papers.abstract

Support