Desaprendizado de Movimento Humano
Human Motion Unlearning
March 24, 2025
Autores: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI
Resumo
Apresentamos a tarefa de desaprendizagem de movimento humano para impedir a síntese de animações tóxicas, mantendo o desempenho geral de geração de texto para movimento. A desaprendizagem de movimentos tóxicos é desafiadora, pois esses podem ser gerados a partir de prompts de texto explícitos e de combinações implícitas de movimentos seguros que se tornam tóxicos (por exemplo, "chutar" é "carregar e balançar uma perna"). Propomos o primeiro benchmark de desaprendizagem de movimento ao filtrar movimentos tóxicos dos grandes e recentes conjuntos de dados de texto para movimento HumanML3D e Motion-X. Propomos baselines, adaptando técnicas de desaprendizagem de imagens de última geração para processar sinais espaço-temporais. Por fim, propomos um novo modelo de desaprendizagem de movimento baseado em Substituição de Código Latente, que denominamos LCR. O LCR é livre de treinamento e adequado aos espaços latentes discretos dos modelos de difusão de texto para movimento mais avançados. O LCR é simples e consistentemente supera as baselines qualitativa e quantitativamente. Página do projeto: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of
toxic animations while preserving the general text-to-motion generative
performance. Unlearning toxic motions is challenging as those can be generated
from explicit text prompts and from implicit toxic combinations of safe motions
(e.g., ``kicking" is ``loading and swinging a leg"). We propose the first
motion unlearning benchmark by filtering toxic motions from the large and
recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines,
by adapting state-of-the-art image unlearning techniques to process
spatio-temporal signals. Finally, we propose a novel motion unlearning model
based on Latent Code Replacement, which we dub LCR. LCR is training-free and
suitable to the discrete latent spaces of state-of-the-art text-to-motion
diffusion models. LCR is simple and consistently outperforms baselines
qualitatively and quantitatively. Project page:
https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.Summary
AI-Generated Summary