ChatPaper.aiChatPaper

Het afleren van menselijke beweging

Human Motion Unlearning

March 24, 2025
Auteurs: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI

Samenvatting

We introduceren de taak van het afleren van menselijke bewegingen om de synthese van giftige animaties te voorkomen, terwijl de algemene tekst-naar-beweging generatieve prestaties behouden blijven. Het afleren van giftige bewegingen is uitdagend omdat deze kunnen worden gegenereerd uit expliciete tekstprompts en uit impliciete giftige combinaties van veilige bewegingen (bijvoorbeeld "schoppen" is "een been laden en zwaaien"). We stellen de eerste benchmark voor het afleren van bewegingen voor door giftige bewegingen te filteren uit de grote en recente tekst-naar-beweging datasets van HumanML3D en Motion-X. We stellen baseline methoden voor, door state-of-the-art technieken voor het afleren van afbeeldingen aan te passen om spatio-temporele signalen te verwerken. Ten slotte introduceren we een nieuw model voor het afleren van bewegingen, gebaseerd op Latent Code Replacement, dat we LCR noemen. LCR is trainingsvrij en geschikt voor de discrete latente ruimtes van state-of-the-art tekst-naar-beweging diffusiemodellen. LCR is eenvoudig en presteert consistent beter dan de baseline methoden, zowel kwalitatief als kwantitatief. Projectpagina: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of toxic animations while preserving the general text-to-motion generative performance. Unlearning toxic motions is challenging as those can be generated from explicit text prompts and from implicit toxic combinations of safe motions (e.g., ``kicking" is ``loading and swinging a leg"). We propose the first motion unlearning benchmark by filtering toxic motions from the large and recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines, by adapting state-of-the-art image unlearning techniques to process spatio-temporal signals. Finally, we propose a novel motion unlearning model based on Latent Code Replacement, which we dub LCR. LCR is training-free and suitable to the discrete latent spaces of state-of-the-art text-to-motion diffusion models. LCR is simple and consistently outperforms baselines qualitatively and quantitatively. Project page: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.

Summary

AI-Generated Summary

PDF12March 25, 2025