EFFACER : Désapprentissage de caractÚres dans les modalités textuelles et visuellesCLEAR: Character Unlearning in Textual and Visual Modalities
Le Désapprentissage Automatique (DA) est essentiel pour améliorer la confidentialité et la sécurité dans les modÚles d'apprentissage profond, en particulier dans les grands modÚles de langage multimodaux (MLLMs), en supprimant des informations spécifiques privées ou dangereuses. Alors que le DA a réalisé des progrÚs significatifs dans les modalités textuelles et visuelles, le désapprentissage multimodal (DMM) reste largement inexploré, en partie en raison de l'absence d'un banc d'essai open source adapté. Pour remédier à cela, nous introduisons CLEAR, un nouveau banc d'essai conçu pour évaluer les méthodes de DMM. CLEAR contient 200 individus fictifs et 3 700 images liées à des paires question-réponse correspondantes, permettant une évaluation approfondie à travers les modalités. Nous évaluons 10 méthodes de DA, en les adaptant pour le DMM, et mettons en évidence de nouveaux défis spécifiques à l'oubli multimodal. Nous démontrons également que la simple régularisation ell_1 sur les poids LoRA atténue significativement l'oubli catastrophique, préservant les performances du modÚle sur les données conservées. Le jeu de données est disponible sur https://huggingface.co/datasets/therem/CLEAR