Make-It-Poseable : Modèle de mise en pose par anticipation pour l'animation de personnages humanoïdes 3D
Make-It-Poseable: Feed-forward Latent Posing Model for 3D Humanoid Character Animation
December 18, 2025
papers.authors: Zhiyang Guo, Ori Zhang, Jax Xiang, Alan Zhao, Wengang Zhou, Houqiang Li
cs.AI
papers.abstract
L'animation de personnages 3D est une tâche fondamentale en informatique graphique et vision par ordinateur. Cependant, les méthodes existantes comme l'auto-rigging et la génération conditionnée par la pose rencontrent des difficultés telles que la prédiction imprécise des poids d'enveloppe, les imperfections topologiques et le faible respect de la pose, limitant ainsi leur robustesse et leur généralisation. Pour surmonter ces limitations, nous présentons Make-It-Poseable, une nouvelle architecture feed-forward qui reformule l'animation des personnages comme un problème de transformation dans l'espace latent. Au lieu de déformer les vertices du maillage comme dans les approches traditionnelles, notre méthode reconstruit le personnage dans de nouvelles poses en manipulant directement sa représentation latente. Au cœur de notre méthode se trouve un transformeur d'animation latente qui manipule les tokens de forme basés sur le mouvement squelettique. Ce processus est facilité par une représentation dense de la pose pour un contrôle précis. Pour garantir une géométrie haute fidélité et accommoder les changements topologiques, nous introduisons également une stratégie de supervision dans l'espace latent et un module d'achèvement adaptatif. Notre méthode démontre des performances supérieures en qualité d'animation. Elle s'étend naturellement à des applications d'édition 3D comme le remplacement et l'affinage de parties.
English
Posing 3D characters is a fundamental task in computer graphics and vision. However, existing methods like auto-rigging and pose-conditioned generation often struggle with challenges such as inaccurate skinning weight prediction, topological imperfections, and poor pose conformance, limiting their robustness and generalizability. To overcome these limitations, we introduce Make-It-Poseable, a novel feed-forward framework that reformulates character posing as a latent-space transformation problem. Instead of deforming mesh vertices as in traditional pipelines, our method reconstructs the character in new poses by directly manipulating its latent representation. At the core of our method is a latent posing transformer that manipulates shape tokens based on skeletal motion. This process is facilitated by a dense pose representation for precise control. To ensure high-fidelity geometry and accommodate topological changes, we also introduce a latent-space supervision strategy and an adaptive completion module. Our method demonstrates superior performance in posing quality. It also naturally extends to 3D editing applications like part replacement and refinement.