ChatPaper.aiChatPaper

Make-It-Poseable: Modelo de Posado por Propagación Directa en el Espacio Latente para la Animación de Personajes Humanoides 3D

Make-It-Poseable: Feed-forward Latent Posing Model for 3D Humanoid Character Animation

December 18, 2025
Autores: Zhiyang Guo, Ori Zhang, Jax Xiang, Alan Zhao, Wengang Zhou, Houqiang Li
cs.AI

Resumen

La pose de personajes 3D es una tarea fundamental en gráficos por computadora y visión artificial. Sin embargo, métodos existentes como el auto-rigging y la generación condicionada por posturas a menudo enfrentan desafíos como la predicción imprecisa de pesos de skinning, imperfecciones topológicas y un pobre ajuste a la postura, lo que limita su robustez y generalización. Para superar estas limitaciones, presentamos Make-It-Poseable, un novedoso framework de avance directo que reformula el posing de personajes como un problema de transformación en el espacio latente. En lugar de deformar vértices de malla como en los flujos tradicionales, nuestro método reconstruye el personaje en nuevas posturas manipulando directamente su representación latente. El núcleo de nuestro método es un transformer de posing latente que manipula tokens de forma basándose en el movimiento esquelético. Este proceso se ve facilitado por una representación densa de la postura para un control preciso. Para garantizar una geometría de alta fidelidad y acomodar cambios topológicos, también introducimos una estrategia de supervisión en el espacio latente y un módulo de finalización adaptativo. Nuestro método demuestra un rendimiento superior en la calidad del posing. Además, se extiende naturalmente a aplicaciones de edición 3D como el reemplazo y refinamiento de partes.
English
Posing 3D characters is a fundamental task in computer graphics and vision. However, existing methods like auto-rigging and pose-conditioned generation often struggle with challenges such as inaccurate skinning weight prediction, topological imperfections, and poor pose conformance, limiting their robustness and generalizability. To overcome these limitations, we introduce Make-It-Poseable, a novel feed-forward framework that reformulates character posing as a latent-space transformation problem. Instead of deforming mesh vertices as in traditional pipelines, our method reconstructs the character in new poses by directly manipulating its latent representation. At the core of our method is a latent posing transformer that manipulates shape tokens based on skeletal motion. This process is facilitated by a dense pose representation for precise control. To ensure high-fidelity geometry and accommodate topological changes, we also introduce a latent-space supervision strategy and an adaptive completion module. Our method demonstrates superior performance in posing quality. It also naturally extends to 3D editing applications like part replacement and refinement.
PDF22December 20, 2025