ChatPaper.aiChatPaper

Desaprendizaje del Movimiento Humano

Human Motion Unlearning

March 24, 2025
Autores: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI

Resumen

Introducimos la tarea de desaprendizaje de movimiento humano para prevenir la síntesis de animaciones tóxicas mientras se preserva el rendimiento general de generación de texto a movimiento. Desaprender movimientos tóxicos es un desafío, ya que estos pueden generarse a partir de indicaciones de texto explícitas y de combinaciones implícitas de movimientos seguros que resultan tóxicos (por ejemplo, "patear" es "cargar y balancear una pierna"). Proponemos el primer punto de referencia para el desaprendizaje de movimiento al filtrar movimientos tóxicos de los grandes y recientes conjuntos de datos de texto a movimiento HumanML3D y Motion-X. Proponemos líneas base al adaptar técnicas de desaprendizaje de imágenes de última generación para procesar señales espacio-temporales. Finalmente, proponemos un nuevo modelo de desaprendizaje de movimiento basado en Reemplazo de Código Latente, al que denominamos LCR. LCR no requiere entrenamiento y es adecuado para los espacios latentes discretos de los modelos de difusión de texto a movimiento de última generación. LCR es simple y supera consistentemente a las líneas base tanto cualitativa como cuantitativamente. Página del proyecto: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of toxic animations while preserving the general text-to-motion generative performance. Unlearning toxic motions is challenging as those can be generated from explicit text prompts and from implicit toxic combinations of safe motions (e.g., ``kicking" is ``loading and swinging a leg"). We propose the first motion unlearning benchmark by filtering toxic motions from the large and recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines, by adapting state-of-the-art image unlearning techniques to process spatio-temporal signals. Finally, we propose a novel motion unlearning model based on Latent Code Replacement, which we dub LCR. LCR is training-free and suitable to the discrete latent spaces of state-of-the-art text-to-motion diffusion models. LCR is simple and consistently outperforms baselines qualitatively and quantitatively. Project page: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.

Summary

AI-Generated Summary

PDF12March 25, 2025