ChatPaper.aiChatPaper

Desaprendizado de Movimento Humano

Human Motion Unlearning

March 24, 2025
Autores: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI

Resumo

Apresentamos a tarefa de desaprendizagem de movimento humano para impedir a síntese de animações tóxicas, mantendo o desempenho geral de geração de texto para movimento. A desaprendizagem de movimentos tóxicos é desafiadora, pois esses podem ser gerados a partir de prompts de texto explícitos e de combinações implícitas de movimentos seguros que se tornam tóxicos (por exemplo, "chutar" é "carregar e balançar uma perna"). Propomos o primeiro benchmark de desaprendizagem de movimento ao filtrar movimentos tóxicos dos grandes e recentes conjuntos de dados de texto para movimento HumanML3D e Motion-X. Propomos baselines, adaptando técnicas de desaprendizagem de imagens de última geração para processar sinais espaço-temporais. Por fim, propomos um novo modelo de desaprendizagem de movimento baseado em Substituição de Código Latente, que denominamos LCR. O LCR é livre de treinamento e adequado aos espaços latentes discretos dos modelos de difusão de texto para movimento mais avançados. O LCR é simples e consistentemente supera as baselines qualitativa e quantitativamente. Página do projeto: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of toxic animations while preserving the general text-to-motion generative performance. Unlearning toxic motions is challenging as those can be generated from explicit text prompts and from implicit toxic combinations of safe motions (e.g., ``kicking" is ``loading and swinging a leg"). We propose the first motion unlearning benchmark by filtering toxic motions from the large and recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines, by adapting state-of-the-art image unlearning techniques to process spatio-temporal signals. Finally, we propose a novel motion unlearning model based on Latent Code Replacement, which we dub LCR. LCR is training-free and suitable to the discrete latent spaces of state-of-the-art text-to-motion diffusion models. LCR is simple and consistently outperforms baselines qualitatively and quantitatively. Project page: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.

Summary

AI-Generated Summary

PDF12March 25, 2025