ChatPaper.aiChatPaper

WalkTheDog : Alignement de mouvements inter-morphologies via des variétés de phase

WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds

July 11, 2024
Auteurs: Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
cs.AI

Résumé

Nous présentons une nouvelle approche pour comprendre la structure périodique et la sémantique des ensembles de données de mouvement, indépendamment de la morphologie et de la structure squelettique des personnages. Contrairement aux méthodes existantes qui utilisent un espace latent de haute dimension excessivement parcimonieux, nous proposons une variété de phase composée de multiples courbes fermées, chacune correspondant à une amplitude latente. Grâce à notre autoencodeur périodique à quantification vectorielle, nous apprenons une variété de phase partagée pour plusieurs personnages, tels qu'un humain et un chien, sans aucune supervision. Ceci est réalisé en exploitant la structure discrète et un réseau peu profond comme goulots d'étranglement, de sorte que les mouvements sémantiquement similaires soient regroupés dans la même courbe de la variété, et que les mouvements au sein de la même composante soient alignés temporellement par la variable de phase. En combinaison avec un cadre amélioré de correspondance de mouvement, nous démontrons la capacité de la variété à aligner le timing et la sémantique dans plusieurs applications, notamment la récupération, le transfert et la stylisation de mouvements. Le code et les modèles pré-entraînés pour cet article sont disponibles à l'adresse https://peizhuoli.github.io/walkthedog.
English
We present a new approach for understanding the periodicity structure and semantics of motion datasets, independently of the morphology and skeletal structure of characters. Unlike existing methods using an overly sparse high-dimensional latent, we propose a phase manifold consisting of multiple closed curves, each corresponding to a latent amplitude. With our proposed vector quantized periodic autoencoder, we learn a shared phase manifold for multiple characters, such as a human and a dog, without any supervision. This is achieved by exploiting the discrete structure and a shallow network as bottlenecks, such that semantically similar motions are clustered into the same curve of the manifold, and the motions within the same component are aligned temporally by the phase variable. In combination with an improved motion matching framework, we demonstrate the manifold's capability of timing and semantics alignment in several applications, including motion retrieval, transfer and stylization. Code and pre-trained models for this paper are available at https://peizhuoli.github.io/walkthedog.

Summary

AI-Generated Summary

PDF122November 28, 2024