ChatPaper.aiChatPaper

인간 동작 언러닝

Human Motion Unlearning

March 24, 2025
저자: Edoardo De Matteis, Matteo Migliarini, Alessio Sampieri, Indro Spinelli, Fabio Galasso
cs.AI

초록

우리는 유해한 애니메이션의 합성을 방지하면서도 일반적인 텍스트-모션 생성 성능을 유지하기 위해 인간 동작 언러닝(unlearning) 작업을 소개합니다. 유해한 동작을 언러닝하는 것은 이러한 동작이 명시적인 텍스트 프롬프트뿐만 아니라 안전한 동작들의 암묵적인 유해한 조합(예: "차기"는 "다리를 들고 휘두르기")으로부터 생성될 수 있기 때문에 어려운 과제입니다. 우리는 대규모 최신 텍스트-모션 데이터셋인 HumanML3D와 Motion-X에서 유해한 동작을 필터링하여 최초의 모션 언러닝 벤치마크를 제안합니다. 또한, 최신 이미지 언러닝 기술을 시공간 신호 처리에 적용하여 베이스라인을 제안합니다. 마지막으로, 우리는 Latent Code Replacement(LCR)라는 새로운 모션 언러닝 모델을 제안합니다. LCR은 학습이 필요 없으며, 최신 텍스트-모션 디퓨전 모델의 이산적 잠재 공간에 적합합니다. LCR은 간단하면서도 질적 및 양적으로 베이스라인을 일관되게 능가합니다. 프로젝트 페이지: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.
English
We introduce the task of human motion unlearning to prevent the synthesis of toxic animations while preserving the general text-to-motion generative performance. Unlearning toxic motions is challenging as those can be generated from explicit text prompts and from implicit toxic combinations of safe motions (e.g., ``kicking" is ``loading and swinging a leg"). We propose the first motion unlearning benchmark by filtering toxic motions from the large and recent text-to-motion datasets of HumanML3D and Motion-X. We propose baselines, by adapting state-of-the-art image unlearning techniques to process spatio-temporal signals. Finally, we propose a novel motion unlearning model based on Latent Code Replacement, which we dub LCR. LCR is training-free and suitable to the discrete latent spaces of state-of-the-art text-to-motion diffusion models. LCR is simple and consistently outperforms baselines qualitatively and quantitatively. Project page: https://www.pinlab.org/hmu{https://www.pinlab.org/hmu}.

Summary

AI-Generated Summary

PDF12March 25, 2025