CLARA: Desaprendizaje de Caracteres en Modalidades Textuales y VisualesCLEAR: Character Unlearning in Textual and Visual Modalities
El Desaprendizaje de Máquinas (MU, por sus siglas en inglés) es fundamental para mejorar la privacidad y la seguridad en los modelos de aprendizaje profundo, especialmente en los grandes modelos de lenguaje multimodal (MLLMs, por sus siglas en inglés), al eliminar información específica privada o peligrosa. Aunque el MU ha avanzado significativamente en las modalidades textual y visual, el desaprendizaje multimodal (MMU, por sus siglas en inglés) sigue siendo ampliamente inexplorado, en parte debido a la falta de un banco de pruebas de código abierto adecuado. Para abordar esto, presentamos CLEAR, un nuevo banco de pruebas diseñado para evaluar métodos de MMU. CLEAR contiene 200 individuos ficticios y 3,700 imágenes vinculadas con pares de preguntas y respuestas correspondientes, lo que permite una evaluación exhaustiva entre modalidades. Evaluamos 10 métodos de MU, adaptándolos para MMU, y destacamos nuevos desafíos específicos del olvido multimodal. También demostramos que la simple regularización ell_1 en los pesos de LoRA mitiga significativamente el olvido catastrófico, preservando el rendimiento del modelo en los datos retenidos. El conjunto de datos está disponible en https://huggingface.co/datasets/therem/CLEAR