PULITO: Eliminazione di Caratteri nelle Modalità Testuale e VisivaCLEAR: Character Unlearning in Textual and Visual Modalities
Il Machine Unlearning (MU) è fondamentale per migliorare la privacy e la sicurezza nei modelli di deep learning, in particolare nei grandi modelli di linguaggio multimodali (MLLM), rimuovendo informazioni specifiche private o pericolose. Mentre il MU ha fatto progressi significativi nelle modalità testuale e visiva, l'unlearning multimodale (MMU) rimane notevolmente inesplorato, in parte a causa dell'assenza di un adeguato benchmark open-source. Per affrontare questo problema, presentiamo CLEAR, un nuovo benchmark progettato per valutare i metodi MMU. CLEAR contiene 200 individui finti e 3.700 immagini collegate a coppie di domande e risposte corrispondenti, consentendo una valutazione approfondita tra modalità diverse. Valutiamo 10 metodi MU, adattandoli per il MMU, e evidenziamo nuove sfide specifiche legate all'oblio multimodale. Dimostriamo inoltre che una semplice regolarizzazione ell_1 sui pesi LoRA mitiga significativamente l'oblio catastrofico, preservando le prestazioni del modello sui dati trattenuti. Il dataset è disponibile su https://huggingface.co/datasets/therem/CLEAR.