Désapprentissage automatique pour les modèles génératifs image-à-image

papers.abstract

L'oubli machine (machine unlearning) est apparu comme un nouveau paradigme permettant d'effacer délibérément des échantillons de données d'un modèle donné afin de se conformer à des réglementations strictes. Cependant, les méthodes existantes d'oubli machine se sont principalement concentrées sur les modèles de classification, laissant le domaine de l'oubli pour les modèles génératifs relativement inexploré. Cet article sert de pont en comblant cette lacune en proposant un cadre unificateur pour l'oubli machine appliqué aux modèles génératifs image-à-image. Dans ce cadre, nous proposons un algorithme efficace sur le plan computationnel, soutenu par une analyse théorique rigoureuse, qui démontre une dégradation négligeable des performances sur les échantillons conservés, tout en supprimant efficacement les informations des échantillons à oublier. Des études empiriques sur deux ensembles de données à grande échelle, ImageNet-1K et Places-365, montrent en outre que notre algorithme ne dépend pas de la disponibilité des échantillons conservés, ce qui respecte davantage les politiques de conservation des données. À notre connaissance, ce travail est le premier à représenter des explorations systémiques, théoriques et empiriques de l'oubli machine spécifiquement adapté aux modèles génératifs image-à-image. Notre code est disponible à l'adresse suivante : https://github.com/jpmorganchase/l2l-generator-unlearning.

English

Machine unlearning has emerged as a new paradigm to deliberately forget data samples from a given model in order to adhere to stringent regulations. However, existing machine unlearning methods have been primarily focused on classification models, leaving the landscape of unlearning for generative models relatively unexplored. This paper serves as a bridge, addressing the gap by providing a unifying framework of machine unlearning for image-to-image generative models. Within this framework, we propose a computationally-efficient algorithm, underpinned by rigorous theoretical analysis, that demonstrates negligible performance degradation on the retain samples, while effectively removing the information from the forget samples. Empirical studies on two large-scale datasets, ImageNet-1K and Places-365, further show that our algorithm does not rely on the availability of the retain samples, which further complies with data retention policy. To our best knowledge, this work is the first that represents systemic, theoretical, empirical explorations of machine unlearning specifically tailored for image-to-image generative models. Our code is available at https://github.com/jpmorganchase/l2l-generator-unlearning.

Désapprentissage automatique pour les modèles génératifs image-à-image

Machine Unlearning for Image-to-Image Generative Models

papers.abstract

Support