CLARO: Desaprendizagem de Caracteres em Modalidades Textuais e VisuaisCLEAR: Character Unlearning in Textual and Visual Modalities
O Desaprendizado de Máquina (MU) é fundamental para aprimorar a privacidade e segurança em modelos de aprendizado profundo, especialmente em grandes modelos de linguagem multimodais (MLLMs), removendo informações específicas privadas ou perigosas. Enquanto o MU avançou significativamente em modalidades textuais e visuais, o desaprendizado multimodal (MMU) ainda é amplamente inexplorado, parcialmente devido à ausência de um benchmark de código aberto adequado. Para abordar essa questão, apresentamos o CLEAR, um novo benchmark projetado para avaliar métodos de MMU. O CLEAR contém 200 indivíduos fictícios e 3.700 imagens vinculadas a pares de perguntas e respostas correspondentes, possibilitando uma avaliação abrangente entre modalidades. Avaliamos 10 métodos de MU, adaptando-os para MMU, e destacamos novos desafios específicos para o esquecimento multimodal. Também demonstramos que a simples regularização ell_1 nos pesos LoRA mitiga significativamente o esquecimento catastrófico, preservando o desempenho do modelo nos dados retidos. O conjunto de dados está disponível em https://huggingface.co/datasets/therem/CLEAR