メイク・イット・ポーズ可能:3Dヒューマノイドキャラクターアニメーションのためのフィードフォワード潜在ポージングモデル
Make-It-Poseable: Feed-forward Latent Posing Model for 3D Humanoid Character Animation
December 18, 2025
著者: Zhiyang Guo, Ori Zhang, Jax Xiang, Alan Zhao, Wengang Zhou, Houqiang Li
cs.AI
要旨
3Dキャラクターポージングはコンピュータグラフィックスおよびビジョンにおける基本的な課題である。しかし、自動リギングやポーズ条件付き生成などの既存手法は、不正確なスキニング重み予測、トポロジーの不完全性、不十分なポーズ適合性といった課題に悩まされており、堅牢性と一般化性が制限されている。これらの限界を克服するため、我々はMake-It-Poseableを提案する。これはキャラクターポージングを潜在空間変換問題として再定義する新しい順伝播型フレームワークである。従来のパイプラインのようにメッシュ頂点を変形する代わりに、本手法は潜在表現を直接操作することで新しいポーズにおけるキャラクターを再構築する。本手法の中核には、骨格運動に基づいて形状トークンを操作する潜在ポージング変換器が存在する。このプロセスは、精密な制御のための高密度ポーズ表現によって促進される。高忠実度な幾何学を保証しトポロジー変化に対応するため、潜在空間監視戦略と適応的補完モジュールも導入する。本手法はポージング品質において優れた性能を示し、部品交換やリファインメントといった3D編集応用へ自然に拡張可能である。
English
Posing 3D characters is a fundamental task in computer graphics and vision. However, existing methods like auto-rigging and pose-conditioned generation often struggle with challenges such as inaccurate skinning weight prediction, topological imperfections, and poor pose conformance, limiting their robustness and generalizability. To overcome these limitations, we introduce Make-It-Poseable, a novel feed-forward framework that reformulates character posing as a latent-space transformation problem. Instead of deforming mesh vertices as in traditional pipelines, our method reconstructs the character in new poses by directly manipulating its latent representation. At the core of our method is a latent posing transformer that manipulates shape tokens based on skeletal motion. This process is facilitated by a dense pose representation for precise control. To ensure high-fidelity geometry and accommodate topological changes, we also introduce a latent-space supervision strategy and an adaptive completion module. Our method demonstrates superior performance in posing quality. It also naturally extends to 3D editing applications like part replacement and refinement.