ChatPaper.aiChatPaper

WalkTheDog: Alineación de Movimiento Cruzado de Morfología a través de Manifolds de Fase

WalkTheDog: Cross-Morphology Motion Alignment via Phase Manifolds

July 11, 2024
Autores: Peizhuo Li, Sebastian Starke, Yuting Ye, Olga Sorkine-Hornung
cs.AI

Resumen

Presentamos un nuevo enfoque para comprender la estructura de periodicidad y semántica de conjuntos de datos de movimiento, independientemente de la morfología y estructura esquelética de los personajes. A diferencia de los métodos existentes que utilizan un espacio latente de alta dimensionalidad excesivamente disperso, proponemos un espacio de fases compuesto por múltiples curvas cerradas, cada una correspondiente a una amplitud latente. Con nuestro autoencoder periódico vector cuantificado propuesto, aprendemos un espacio de fases compartido para múltiples personajes, como un humano y un perro, sin ninguna supervisión. Esto se logra explotando la estructura discreta y una red superficial como cuellos de botella, de modo que los movimientos semánticamente similares se agrupen en la misma curva del espacio, y los movimientos dentro del mismo componente se alineen temporalmente por la variable de fase. En combinación con un marco de coincidencia de movimiento mejorado, demostramos la capacidad del espacio de fases para el alineamiento temporal y semántico en varias aplicaciones, incluyendo la recuperación, transferencia y estilización de movimiento. El código y los modelos pre-entrenados para este artículo están disponibles en https://peizhuoli.github.io/walkthedog.
English
We present a new approach for understanding the periodicity structure and semantics of motion datasets, independently of the morphology and skeletal structure of characters. Unlike existing methods using an overly sparse high-dimensional latent, we propose a phase manifold consisting of multiple closed curves, each corresponding to a latent amplitude. With our proposed vector quantized periodic autoencoder, we learn a shared phase manifold for multiple characters, such as a human and a dog, without any supervision. This is achieved by exploiting the discrete structure and a shallow network as bottlenecks, such that semantically similar motions are clustered into the same curve of the manifold, and the motions within the same component are aligned temporally by the phase variable. In combination with an improved motion matching framework, we demonstrate the manifold's capability of timing and semantics alignment in several applications, including motion retrieval, transfer and stylization. Code and pre-trained models for this paper are available at https://peizhuoli.github.io/walkthedog.

Summary

AI-Generated Summary

PDF122November 28, 2024